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EDITORIAL 


Num passado não distante a TÉCNICA configurou-se numa revista plena 
de interesse, integrando trabalhos de vanguarda nos domínios da ciência e 


da técnica. 
Espera-se que a partir de 1991 retome o ritmo perdido. 


Caminhar para esses objectivos e dar realidade às grandes finalidades 
de uma revista com a tradição da TÉCNICA é tarefa que apela 
necessariamente para os docentes, investigadores e alunos do I.S.T. e bem 
assim para todos aqueles que cultivam os domínios científicos e técnicos 


que servem a Engenharia. 


Para relançar a revista há que acreditar na TÉCNICA, na acção que pode 
desenvolver na comunidade técnico-científica e, nomeadamente, ter 
presente que, em princípio, os artigos da TÉCNICA são referidos nos 


Abstracts das diferentes especialidades científicas. Assim tem acontecido. 
Repetimos quanto, de essencial, se julgou dever salientar no número 

anterior. No entanto, alguma coisa mais há que dizer: 

Assim, é-nos grato confirmar que o ritmo que se imprimiu à TECNICA se 

mantém, não esmoreceu. 

É-nos profundamente grato, também, salientar a forma generosa como o 


Conselho Directivo do I.S.T. tem acarinhado os nossos esforços, 


ouvindo-nos e concedendo-nos significante apoio material. 
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Situação Científica sobre a Compreensão da Língua 


Natural 


Helder Coelho 


Professor Catedrático do Instituto Superior de Economia e Gestão, 


Universidade Técnica de Lisboa 
Chefe de projecto do INESC 


RESUMO 


O avanço muito rápido e a popularização recente da 
Inteligência Artificial (IA) obrigam-nos a realizar com 
regularidade pontos de situação sobre os avanços e os 
recuos verificados, não só nas suas áreas de aplicação, 
mas também no que respeita às suas metodologias, 
técnicas e instrumentos. À compreensão da língua 
natural (LN) é um bom exemplo para analisarmos as 
fronteiras actuais da IA, pois esta disciplina tem 
progredido por saltos e num terreno multidisciplinar. 
No presente artigo focam-se os seus aspectos centrais, 
as dificuldades presentes e sobretudo as esperanças em 
conhecer melhor os modos de processar os significados 
das frases trocadas entre os interlocutores em 
presença, quer isoladas ou em contexto. Em síntese, 
trata-se de falar sobre o tema geral da comunicação 
homem-máquina, mas sob o ponto de vista dos 
fenómenos cognitivos subjacentes. 


1- INTRODUÇÃO 


Após um período dourado na década de 70 
(perguntas/respostas SHRDLU deWinograd, tradução 
automática de Wilks, perguntas/respostas LUNAR de 
Woods, compreenção de histórias MARGIE, SAM e PAM 
de Schank, pesquisa de bases de dados ROBOT de Harris 
e LIFER de Hendrix), a área da compreensão da língua 
natural (LN) da Inteligência Artificial (IA) entrou num 
período longo de amadurecimento, vislumbrando-se 
apenas algumas saídas cujo êxito possa ser calculado 


com facilidade. 


Ao longo deste artigo enunciam-se as fronteiras que 
se colocam contra o progresso acelerado da I&DE desta 
área, apontando-se as várias vias de investigação em 


Este texto corresponde à lição convidada, proferida pelo autor 
durante o 1. Congresso Ibero-Americano de Inteligência Artificial 
(IBERAMIA-BB) que decorreu de 11 a 13 de Janeiro de 1988 em 
Barcelona (Espanha). 

Original entregue para publicação em 2 de Maio de 1988 

Revisto a 16 de Fevereiro de 1991 


ABSTRACT 


The fast advance and recent popularization of 
Artificial Intelligence (Al) force us to do regular states 
of the art about the application areas, methodologies, 
techniques and tools. The understanding of natural 
language is a good example for the analysis of the 
actual borders of Al, because the discipline progressed 
by jumps and in a multidisciplinary ground. 

Along the present paper we focus the central issues, 
the present difficulties, and the hopes in knowing 
better the processing modes of sentence meanings 
exchanged among interlocutors, either isolated or in 
context. Briefly, we discuss the general topics of 
human-machine communication, taking the point of 
view of the cognitive associated phenomena. 


curso e esboçando os terrenos mais férteis para o avanço 
e as dificuldades que o impedem. 

Mas, o que é compreender uma língua natural? Como 
se realiza uma tal compressão? E, onde e quando se faz 
essa compreensão? Estas perguntas continuam a 
motivar respostas que ainda são parciais e que 
necessitam de ser articuladas, como se resume na figura 
1. Por um lado, tais interrogações têm permitido a 
descoberta de problemas cujas soluções implicam o 
recurso a diversas disciplinas. E, por outro lado as 
dificuldades surgidas têm aberto lugares de intervenção 
cientifica e têm alargado as fronteiras do nosso 
conhecimento. 

A LN é um termo impreciso, dependente da 
clarificação das capacidades linguísticas e das 
capacidades humanas (memória, raciocínio, resolução de 
problemas, formação de hipóteses, classificação, 
planeamento, consciência social e aprendizagem). A LN, 
como afirma William Woods, assume a compreensão da 
parte do ouvinte, e não se restringe a uma mera 
descodificação. Compreender uma LN envolve não só o 
conhecimento da estrutura da língua (léxico, sintaxe, 
semântica e morfologia), o conhecimento de uma 
situação (contexto), mas também o conhecimento geral 
(mundo e universo) e o recurso ao raciocínio. Uma tal 
compreensão pode ser automatizada ao longo de diversos 
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Compreensão da LN 


Aprender a construir programas de computador que 


possam comunicar e interagir com os seres 
inteligentes num modo em tudo idêntico ao 
adoptado pelos próprios seres humanos no seu | 


inter-relacionamento 


Motivação: 
linguagem e do pensamento 


Sub-áreas: Frases isoladas 


| relacionadas 


Compreensão da LN 

(escrita ou falada) 

Tradução automatizada da LN 
Geração de textos 


Diálogos, Discursos 


Lexicografia e morfologia 
figura 1 - Quadro resumo 
níveis como se indica na figura 2, mas ainda não está 
claro em que nível podemos afirmar que finalmente 
atingimos a compreensão da LN. 


DESCRIÇÃO GRAMATICAL (“PARSING") 


Processamento de frases em descrições estruturais usando | 


descrições gramaticais da estrutura linguistica. 


INTERPRETAÇÃO SEMÂNTICA 


Aplicação da descrição estrutural da frase numa forma lógica que | 


apresenta o significado independente do contexto 


INTERPRETAÇÃO CONTEXTUAL 


Aplicação das formas sintáctica e lógica na representação final da 


compreensão da frase. 


REPRESENTAÇÃO DO SIGNIFICADO 


Escrita numa linguagem que suporta uma componente de 
inferência para modelar o raciocínio natural 


figura 2 - Níveis de processamento da compreensão da LN 


A leitura da figura 2 permite desde logo evocar dois 
sub-problemas que estão interligados e que são de facto 
os obstáculos maiores para se atingir uma compreensão 


plena: 

Representação: Como são representadas as 
possíveis interpretações 
diferentes em cada nível? 

Interpretação: Como são produzidas as 


representações apropriadas em 
cada nível, desde a entrada até 
esse nível? 


À compreensão da LN é muito difícil e cada vez 
envolve mais esforço para que se verifique um progresso 
real no seu conhecimento. Nos últimos anos os avanços 
têm sido lentos e de espectro cada vez mais lato, porque 
esta área envolve muito mais do que responder a 
perguntas isoladas, tal como se aponta na figura 3, ao 
apresentar-se o campo de intervenção do Center for the 
Study of Language and Information (CSLI) criado em 
1983 nos EUA, através da Stanford University, do SRI 
International e da Xerox Parc. 

À título de exemplo podemos ver como três destas 
disciplinas citadas na figura 3 se referem à língua e 
como a encaram com pontos de vista diferentes, mas 
complementares: 


Alargar a nossa compreensão sobre a natureza da | 


INTELIGÊNCIA 
ARTIFICIAL 


(Teoria dos tipos, 
Linguagens 
reflexiveis, 
Processamento do 
conhecimento, 
Teoria dos dominios, 
Teoria das 
linguagens) 


te resantação do 
conhecimento 
inferência, 
unificação, 
distribuição da 
inteligência), 


TEORIA GERAL 
jo DA 
INFORMAÇÃO 


ESTUDO DA 
LINGUAGEM E DA 
INFORMAÇÃO 


| 

CIÊNCIAS DO 
COMPUTADOR 
LINGUÍSTICA 


fe COMPUTACIONAL 

ca, PSICOLOGIA (Sintaxe ( Palavras 

Filosofia da | Tool 

Linguagem) COGNITIVA Frases 
(Cognição humana, Semântica, 


Organização da Programática) )LN 
memória, 
Simulação 


cognitiva) 


figura 3 - Campo de intervenção do CSLI 


LINGUÍSTICA: 
modelos estruturais da língua 


PSICOLOGIA COGNITIVA: 
modelos do uso da lingua 


INTELIGÊNCIA ARTIFICIAL: 
modelos (computacionalmente eficientes) do uso da 
língua em comunicação. 


Seleccionando a disciplina Linguistica 
Computacional podemos enumerar os seus vários | 
objectivos, através da sua decomposição nas suas três 
áreas tradicionais: 


Gramática de contexto livre (CFG) 


ANÁLISE SIN- Gramática de contexto livre aumentado 
TATICA Constrições gramaticais 
Fontes de ambiguidade sintática 
Representação do significado 
ANALISE Constrições semânticas 
SEMÂNTICA Análise de quantificadores 
Identificação de informação implícita 
ANALISE DO  Estabecimento da coerência textual 
DISCURSO Enquadramentos 
Guiões 


e observar como elas se cruzam entre si, Em resumo, 
podemos afirmar que estamos perante fenómenos de 
uma grande complexidade, e cuja compreensão exige 
uma acção multidisciplinar em várias frentes. 
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A nível internacional e após a publicação da tese de 
doutoramento de Terry Winograd em 1972 o progresso 
real na LN foi significativo, com contribuições 
importantes, principalmente nos domínios da sintaxe e 
da semântica. A área passou de 2º lugar (1981) para 1º 
lugar (1983) no que respeita o número de comunicações 
apresentadas, na Conferência Internacional Conjunta de 
IA (IJCAI), que se realiza de dois em dois anos. Em 1985 
desceu para 3º lugar, confirmando-se esta queda em 
1987 ao passar para 5º lugar [6]. 

Do ponto de vista mais geral, a situação da 
comunicação homem-máquina tem sido até hoje 
menos que satisfatória. Esta área é muito importante 
para o alargamento da população dos utilizadores de 
computadores, pois tem como objectivo oferecer modos 
mais flexíveis de interacção, facultando aos não 
informáticos interfaces amigáveis com os produtos 
informáticos. No entanto, e face à grande expectativa, 1) 
não existe ainda uma norma para as representações 
internas, 2) nem todos os fenómenos linguísticos podem 
ser resolvidos ao mesmo nível de processamento, 3) 
existem dificuldades em coordenar estratégias de 
análise que são múltiplas e independentes, e 4) é dificil 
descobrir-se uma solução geral para a descrição do 
significado das frases por causa da natureza da estrutura 
gerada. Tudo isto reflecte-se nas capacidades reais das 
interfaces, em geral eficientes apenas em mundos 
fechados e perante pequenos subconjuntos de uma LN, 

Observando também o que é um agente inteligente 
descobrimos imediatamente cinco traços que são 
pertinentes para os trabalhos em compreensão da LN. A 
saber, a comunicação (leia-se a facilidade de conversa), o 
conhecimento interno (do sistema), o conhecimento do 
mundo (e a faculdade de aquisição de mais 
conhecimentos), a intencionalidade (a elaboração e a 
compreensão de planos/objectivo), e a criatividade (uma 
nova maneira de olhar para algo que muda o nosso 
mundo). Alguns destes aspectos são focados nas secções 
seguintes, mas as dificuldades do progresso têm sido 
enormes levando os investigadores a ensaiarem soluções 
alternativas e provisórias na procura de uma solução 
geral e global. A diversidade de metodologias, técnicas, 
formalismos e teorias demonstra que estamos ainda 
longe de conseguir uma visão completa dos fenómenos 
linguísticos. 

À compreensão da língua natural pode ser discutida 
essencialmente através de dois pontos de vista, o 
reconhecimento ao nível da frase e os diálogos 
interactivos, que serão em seguida discutidos com algum 
detalhe. 


2 - Reconhecimento ao nível da frase 


(Quando se aborda o reconhecimento ao nível da frase 
é necessário ter presente que uma lingua é um veículo 
para transmitir conceitos de mudança, de lugar, de 
causalidade e de objectivo. E, que a compreensão de uma 
língua natural recorre a diversos dispositivos, Lais como 
a referência pronominal (anáfora), a elipse, a 
modificação da cláusula relativa, a quantificação, a 
modificação de conceitos por adjectivos e advérbios, e as 
transformações focadas na atenção. Assim, existem 


Helder Coelho 


características que um utilizador dos sistemas de LN 
não deve esquecer. Mas, ao procurar identificá-las é 
necessário saber colocar as perguntas apropriadas: 


Pergunta: e Será queo sistema X tem a 

errada caracteristica Y? 

Perguntas: e Até que ponto da característica Y é 
certas capaz o sistema X? 


e Até que ponto é importante a 
característica Y para a minha aplicação? 


No entanto, nem todas as características estão 
actualmente compreendidas e dominadas, como em 
seguida se anota, 


Ci: COBERTURA: 
competência linguística de um sistema, analisada 
ao longo das dimensões seguintes: 


Cobertura Lexical: 
quantidade de vocábulos (preposições, conjunções, 
artigos, etc.) 


Cobertura sintáctica: 
fenómenos sintácticos (formas verbais complexas, 
cláusulas relativas, formas de perguntas, 
passivos, comparativos, cláusulas subordenadas, 
advérbios de tempo e lugar, expressões de medida, 
elipse, pronomes e conjunções) 


Cobertura semântica: 
capacidade de compreensão 


C2: HABITALIDADE: 
velocidade de reconhecimento e adaptação do 
utilizador às limitações do sistema 


C3: INFERÊNCIA: 
capacidade de tirar conclusões com base nos dados 
e no conhecimento disponível 


C4: CONTROLE DA INTERPRETAÇÃO PELOS 
UTILIZADORES: 
capacidade de recorrer ao contexto (com 
limitações) 


C5: USO DE PRONOMES: 
referência a acções e a objectos no discurso (com 
limitações) 


C6: OUTROS TIPOS DE REFERÊNCIA: 
recurso a agregados 


C7: ELIPSE: 
capacidade de encher partes da conversa através 
do contexto 


C8: QUANTIFICAÇÃO: 
uso de conhecimento de senso comum para 
Interpretar palavras como alguns e quaisquer 
(com limitações) 
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C9: NEGAÇÃO: 
em frases nominais e verbais, e combinada com a 
quantificação (com limitações) 


Cio: TEMPO E ASPECTO: 
em aberto e investigação, pois não existem 
mecanismos gerais para representar 
efectivamente e eficientemente acontecimentos e 
objectivos que se alteram com o tempo (em aberto) 

Cit: CONJUNÇÃO E DISJUNÇÃO: 
recurso aos "e" e "ou", em combinação com as 
elipses e outros fenómenos (em aberto) 

Ci2: ENTRADA TELEGRÁFICA: 
recurso a abreviaturas (em aberto) 

C13: ENTRADAS NÃO GRAMATICAIS: 


recurso a formas habituais (em aberto) 


O problema básico do processamento da LN é a 
resolução da ambiguidade (sintáctica ou estrutural, 
semântica das palavras, casos, referencial e 
literalidade), isto é pretende-se traduzir frases ambíguas 
em representações internas não ambíguas. Contudo, não 
existe ainda uma norma geral para as representações 
internas e são variados os tipos de representações de 
conhecimento disponíveis na área da IA que têm sido até 
agora experimentados: 


- EXPRESSÕES DE UMA LINGUAGEM 
DE PESQUISA (para acesso a BD's) 


- FORMULAS LÓGICAS 


- ÁRVORES DE DESCRIÇÃO COM 
PALAVRAS EM NÓS TERMINAIS 


TIPOS (para tradução automatizada) 
DISPONÍVEISDE |  xprESSÕES LISP (para sistemas 
REPRESENTAÇÕES 


periciais) 


- INSTANCIAÇÕES DE 
ENQUADRAMENTOS (varios) 


- DEPENDÊNCIAS CONCEPTUAIS 
(para compreensão de histórias) 


Estes tipos de representações adequam-se a certos 
fenómenos linguísticos ou a aspectos particulares da 
compreensão de uma LN, e portanto revelam-se 
incompletos quando se pretende construir um sistema 
global. 

Quanto aos formalismos gramaticais existem 
actualmente cerca de trinta propostas, e nenhuma delas 
é capaz de dar uma resposta global, completa € 
categórica aos fenómenos linguísticos. Vejamos algumas 
variedades desses formalismos, agrupados em torno da 
sintaxe e da semântica. 


TEORIAS SINTÁTICAS: 
GBT. GOVERNMENT BINDING THEORY 
(Chomsky, 1981) 


DCG: DEFINITE CLAUSE GRAMMAR (Coelho, 
1979; Pereira e Warren, 1981) 

FG: FUNCTIONAL GRAMMAR (Kay, 1979) 

FUG: FUNCTIONAL UNIFICATION GRAMMAR 
(Kay, 1984) 

LFG: LEXICAL FUNCTIONAL GRAMMAR 


(Bresnan, 1982) 


GPSG: GENERALIZED PHRASE STRUCTURE 
GRAMMAR (Gazdar, 1985) 


LEXICON GRAMMAR (Gross, 1986) 


CATEGORIAL GRAMMAR (Dowty, 1982: 
Bach, 1983; Steedman, 1985) 


IG: INDEXED GRAMMAR (Gazdar, 1985) 
HEAD GRAMMAR (Pollard, 1984) 


HEAD-DRIVEN PHRASE STRUCTURE 
GRAMMAR (Sag e Pollard, 1987) 


IG: INCREMENTAL GRAMMAR (Kempen, 1987) 


CFQG: CONTEXT-FREE QUEUE GRAMMAR 
(Manaster-Rena, 1986) 


TREE ADJOINING GRAMMAR (Joshi, Levy 
& Takahashi, 1975) 


TEORIAS SEMÂNTICAS: 
SITUATIONAL SEMANTICS (Bairwise e Perry, 1983) 


DISCOURSE REPRESENTATION THEORY (Kamp, 
1981; Heim, 1982) 


PROCEDURAL SEMANTICS (Wood, 1968) 
CONCEPTUAL DEPENDENCY (Schank, 1975) 
MONTAQUE SEMANTICS (Montague, 1970) 
COMPOSITIONAL SEMANTICS 
KNOWLEDGE-BASED SEMANTICS 


Alguns destes formalismos/teorias possuem aspectos 
semelhantes e portanto podem convergir, do modo como 
é indicado em seguida na figura 4. 


Figura 4 - Convergência de formalismos 
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As razões para uma tal convergência destes 
formalismos gramaticais são as seguintes: 


1) Apoiam-se em relações de dependência, recorrendo a 
noções como "cabeça", 

2) Tomam em consideração os aspectos funcionais, 

3) Defendem que a sintaxe deve ser restringida do ponto 
de vista lexical, e por isso colocam uma grande parte 
da informação gramatical no léxico, e 

4) Baseiam os seus algoritmos no princípio da 
unificação, que diz que “As categorias complexas são 
colocadas em acordo no contexto sintáctico”. 


Vejamos em detalhe as características de três destes 
formalismos convergentes: 
LFG 
Baseia as suas c-estruturas sintácticas no princípio da 
estrutura sintagmática. 
FUG 


As f-estruturas funcionais representam relações entre 
functores e argumentos. 


GPSG 


Introduz mais regras para restringir de forma 
adequada o formalismo. 
O controle da análise é distribuido por muitas fontes. 


Os formalismos gramaticais podem-se também 
agrupar em famílias canónicas, tais como: 
- | "DEFINITE CLAUSE GRAMMAR" (DCG) 


"FUNCTIONAL UNIFICATION GRAMMAR" 
(FUG) 


- | "LEXICAL FUNCIONAL GRAMMAR" (LFG) 


"GENERALIZED PHRASE STRUCTURE 
GRAMMAR" (GPSG) 


- | "UNIFICATION-BASED GRAMMAR”" (PATR, 
PATR-II, S-PATR) 


as quais comunicam entre si como se mostra na figura 5 


Figura 5 - Famílias canônicas de gramáticas 


Helder Coelho 


Consideremos dois exemplos que mostram como estes 
formalismos comunicam entre si: 


Exemplo 1: 
Análise: "Dowty gapping analysis” 
Método: CUG 


Gramática de implementação: PATR-Il 


Exemplo 2: 
Análise: GP&S 
análise de verbos auxiliares 
Método: LFG 
Gramática de implementação: DCG 
Parsing: via tradução BUP 


("Bottom Up Parser”) 


Vejamos agora na figura 6 as técnicas que foram 
sendo propostas para a análise da LN, isto é para a 
tradução das fases da LN em apenas uma representação 
interna. 


- ASSOCIAÇÃO DE PADRÕES (ELIZA/PARRY) 
- DESCRIÇÃO CONDUZIDA SINTÁCTICAMENTE 
(ATN's) 


- GRAMÁTICAS SEMÂNTICAS (SOPHIE, LIFER) 


- INSTANCIAÇÃO DE ENQUADRAMENTOS DE CASOS 


(ELI) 
(MARCUS) 
(SMALL) 


- ESPERE E VEJA 
" - PERITO EM PALAVRAS 
- CONECCIONISMO (SMALL) 
| - RASPAGEM (FRUMP, IPP) 


Figura 6 - Técnicas de análise de LN 


Destas técnicas de análise vejamos algumas delas com 
mais pormenor: 
ASSOCIAÇÃO DE PADRÕES (Weizenbaum, Colby) 
e interpretação global das frases, através da 
associação de padrões (interpretações) das palavras 
à frase de entrada. 


associação 
: FRASE DE LN ——ei [Interpretação 
Figura 7 - Esquema da associação de padrões 


DESCRIÇÃO CONDUZIDA SINTACTICAMENTE 

(Bobrow, Fraser, Woods) 

e interpretação construtiva através da combinação da 
estrutura (unidades de alto nível: frases,cláusulas, 
sintagmas) e do significado das palavras ou de outros 
constituintes de nível mais baixo. 

A sua ineficiência pode ser combatida através da 
mistura da descrição ("parsing") com a 
interpretação. 


ANÁLISE SINTÁTICA = APLICAÇÃO DE UMA GRAMÁTICA 


O = ii 


CONTEXTO TRANSFORMACIONAIS ATN's 
LIVRE (SENSÍVEIS AO CONTEXTO) 


Figura 8 - variedades sintácticas 
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GRAMÁTICAS SEMÂNTICAS (Burton, Hendrix) 

e interpretação construtiva, através da combinação de 
categorias definidas do ponto de vista sintáctico e 
semântico (reconhecimento por uma gramática 
sintáctica antes da interpretação semântica). 


Desvantagens: tendem a tornar-se muito grandes e 
são dificeis de construir 


Variantes: 
1)- misturar sintaxe com semântica 
(RUS/Bobrow) 


2)- abstracção dos aspectos comuns linguísticos 
da gramática semântica para uma certa 
aplicação (TEAM/Grosz) 

3)- multi-estratégias de descrição para gerar 
formas canónicas antes do uso da gramática 
semântica ( DYPAR/Carbonell) 


INSTANCIAÇÃO DE ENQUADRAMENTOS DE 

CASOS (Simmons, Schank, Riesbeck) 

e natureza recursiva e capacidade para combinar o 
reconhecimento de constitutintes chaves via da base 
para o topo (BUP) com a instanciação de 
constituintes menos estruturados do topo para a base 
CLDP). 

Vantagens: descrição robusta adequada a enfrentar 
erros de escrita do utilizador. 


Ora, nem todos os fenómenos linguísticos podem ser 
resolvidos no mesmo nível de análise, e dai a existência 
de diferentes técnicas. 


Exemplo: 
Correcção de erros: nivel léxical 
Elipse : níveis sintáctico e pragmático 
Anáfora : níveis semântico e sintáctico 


Perante estas dificuldades Carbonell e Hayes têm 
defendido que se devem adequar as estratégias de 
análise aos tipos de construção linguística específicas. 
Esta via está ainda em investigação, apresentando desde 
já uma grande dificuldade: coordenação de estratégias 
de análise que são múltiplas e independentes. 

As fases e a ordem na análise das frases de LN 
também podem ser variadas consoante se pretende 
enfrentar certos fenómenos linguísticos. Em seguida 
apresentam-se três alternativas, e citam-se os autores 
que se adoptaram. 


A) Sintaxe e depois Semântica ELISÃO 


ANÁFORA 
QUANTIFICAÇÃO 
(Woods, 1972) 
(Mellish, 1979) 
(Pereira, 1983) 
(Groszetal, 1987) 


B) Semântica e depois Sintaxe ANÁFORA 
(Schank & Tesler, 1969) 
(Wilks, 1972) 
(Riesbeck & Schank, 1976) 


C) Sintaxe mais Semântica QUANTIFICAÇÃO 


MODIFICADORES 
(Woods, 1970) 
(Burton, 1970) 
(Winograd, 1972) 
(Dahl, 1978) 
(Coelho, 1979) 


Também não existe uma direcção e estilo único de 
processamento da compreensão dos significados, como se 
faz notar em seguida na figura 9. 


NÃO DETERMINÍSTICOS 


| ANALISADORES 
| DETERMINÍSTICOS 
DO TOPO PARA A BASE (TDP) 


ANALISADORES OLHAR PARA A FRENTE (LOOK HEAD) 


DA BASE PARA O TOPO ABV 
Figura 9 - Direcções de processamento | 


Tudo isto aponta para grandes dificuldades em 
encontrar uma solução geral quanto ao reconhecimento 
de frases de LN, por causa da natureza de estrutura 
gerada. Na figura 10 apresenta-se a organização de uma 
interface transportável (Grosz et al, 1987), onde se pode 
observar a complexidade das diversas fases de 
processamento. 


| 
DESCRITOR E 
| 
| — . 
| 


ÁRTORE COM 
AROUMENTOS AHOTADOS | 


EE 


RESPOSTA DA BD 


figura 10 - Sistema TEAM 


A exploração de instrumentos, técnicas e 
metodologias tem sido contínua ao longo dos anos, como 
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variedades lógicas. 


se aponta na figura 11, de forma esquemática e para as 


WINOGRAD (1972) 


COLMERAUER (1975) 


DAHL (1977) 


COELHO (1979) PEREIRA 


(1982) 


LOPES (1986) 


GROSZ et al, 
(1987) 


figura 11 . Evolução da investigação em LN 


Consideremos agora o tópico das formas lógicas para 
compararmos algumas destas vias de investigação, 
nomeadamente a de (Coelho, 1979) com o sistema TUGA, 
a de (Warren e Pereira, 1981) com o sistema CHAT-80, a 
de (Lopes, 1986) com o sistema SSIPA e a de (Grosz et al, 
1987) com o sistema TEAM, Para cada um destes 
sistemas apresentamos em seguida uma frase de LN e a 
correspondente descrição lógica do seu significado. 


TUGA > Nenhum editor tem outro autor. 


não( 
para(X1, 
eteditor (X1) 
para(X2, 
e(autor (X2), 
tem (X1,X2)), 
card (X2, maior, 0))), 
card (X1, maior, 0))) 
Chat-80 > Which countries bordering the Mediterranean 
border Asian countries? 
answer (C) < = country (C) & 
border (C, mediterranean) & 
exists (C 1, country (C1) & 
asian (C1) & borders (C,C1)) 


Na figura 12 comparam-se dois sistemas, o CHAT-80 e o 
SSIPA, e mostra-se como a evolução do primeiro para o 
segundo foi obtida através da maior complexificação do 


Helder Coelho 


SSIPA > Escreva uma mensagem ! 


imperativa < = = 
eu (A:X) & 
mensagem (B:Y, de C:Z, para: D:W) & 
escrever (A.X, mensagem & B:Y) 


Chat-80 > Escreva uma mensagem ! 


imperativa < = = 
eu (X) & mensagem (Y,2,W) & escreva (X,Y) 


processamento, logo gerando uma maior capacidade de 
compreensão. 


descodificar( aux) & mensagen(Y,Z,M) & escrvartx, 1) ) 
É iai TI 
descodificar( escrvertx,n ) 


descodificar( nu00 ) 
| 


BASE DE DADOS 


descodificar( mensascr zu ) 


Fa 


| —  pescogiticar Ra 
a É mera par Dodo d) É escrever! JF 


| descodificar 
escreveria dy) 
i 


Ea 


ESPECIASLISTA COGNITIVO 
, DE TIPO. | 
SINTACT ICO-SEMANT ICO, 


figura 12 - Comparação de dois tipos de compreensão 


No caso do sistema TEAM o tipo de representação é 
ligeiramente diferente, como se mostra em seguida. 

Voltemos de novo à questão da representação dos 
significados e vejamos através de uma série de exemplos 
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TEAM> Show each continent's highest peak 
SHOW EACH CONTINENT GEN EST HIGH PEAK. 
FOUR PARSES WERE FOUND. 


(IMPERATIVE 
(ALL + WORLDC-CONTINENT + 2 
(+ WORLD-CONTINENT + + 
+ + WORLDC-CONTINENT + 2) 
(THE PEAK + 1 
(AND 
(+ PEAK + + PEAK + 1) 
(((*SUPER*("MORE**HIGH)) 
+ PEAK + 5 
(AND (+ PEAK + + PEAK +5) 
(* PK CONT-CONTINENT-OF 
PEAK + 5 + WORLDC-CONTINENT + 2))) 
+ PEAK + 1)) 
("SHOW + YOU + + SPEAKER + + PEAK + 1)))) 
FOR EVERY CONTINENT 
FOR THE UNIQUE PEAK 
SUCH THAT THE PEAK IS THE HIGHEST PEAK SUCH THAT 
THE CONTINENT IS CONTINENT OF THE PEAK 
YOU SHOW SPEAKER THE PEAK 


como (Allen, 1987) organiza as descrições ao longo de 
dois níveis, o da sintaxe e o da semântica. 


Sintaxe: estrutura da frase 


John sold the book to Mary. 


(S SUB) (NP NAME John 
NUM (3s)) 
MAIN-V sold 
TENSE (PAST) 
VOICE (ACTIVE) 
OB) (NP DET the 
HEAD book 
NUM (35)) 
MODS (PP PREP to 


POBJ (NPNAME Mary 


NUM (353) 
Semântica: forma lógica 
Jack took Mary to the Halloweenball. 
(PASTII TAKE-ACTION [AGENT (NAME p1 PERSON "Jack”")] 
[THEME(NAME p2 PERSON “Mary”)] 


ITO-LOC(DEFISING b1 PARTY 
(CELEBRATES bi HALLOWEEN))]) 


Se focarmos a forma de representação de (Allen, 1983) 
podemos observar como a anáfora entre frases é 
resolvida. 


When does the flight from Boston arrive in Chicago? 


(5 WH-QUERY (PPIHEAD when) 

SUBI (NP1 DET the 

HEAD flight 

NUM (3p) 

MODS (PP PREP from 

POB) (NP2 NAME Boston))) 
MAIN-V arrive 
TENSE PRES 
MODS ((PP PREP In 
POB) (NP3 NAME Chicago)) 
+PP1)) 


Os referentes são organizados numa estrutura que 
contém a história da interacção, e que serve depois para 
apoiar a resolução de problemas linguísticos. 


Constituintes Objecto Tipo » 
NP3 CHI CITY 
NP1 FLIGHTO124 FLIGHT 
NP3 BOS CITY 


Consideremos agora a pergunta seguinte para 
explicar como é resolvida a referência introduzida por 
“that flight”. 

Does that flight serve lunch? 


see that flight ses 


(NP DET that 
HEAD flight 
NUM (35) 
SEM (PRO/SING f1 FLIGHT)) 


O teste sobre a lista com a história da interacção é 
feito recorrendo à informação da abertura SEM daquela 
estrutura. Em primeiro lugar, ocorre um falhanço com o 
constituinte 1, e depois dá-se um sucesso com O 
constituinte 2. 


REF = FLIGHT 0124 


referente para "that flight. 


Vejamos, finalmente, como se constrói a 
representação final de uma frase segundo (Allen, 1987). 
Consideremos a seguinte frase, 


Jack bought a car. 


(PAST bi BUY [AGENT (NAME |1 PERSON “Jack ”)] 
ITHEME(INDEFISING C1 CAR)]) 


l) Aplicação dos sintagmas nominais aos termos da 
base de conhecimentos (BC) que representam os seus 
referentes 


referente de Jack : JACK 1 
referente dea car: CAR 18 
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2) Aplicação das partes proporcionais (acções) da 
forma lógica à BC 


(B1 isa PURCHASE with 
[Buyer JACK] 
[Seller Seller (B1)] 
[Object CAR 1] 
Precondition: HAS(JACK 1, Prince (CAR 1)) 
Delete: HAS(JACK 1, Prince (CAR)) 
Add: HAS(JACK 1, CAR 1) 
Decomposition: GOTO(JACK 1, Loc(Seller (B1))) 
GIVEJACK 1, Seller(B1), 
(CAR 1)) 
GIvVE(Seller(B1), Jack 1, 
CAR 1)) 


definição da 
classe PURCHASE 


Cria uma instância P1 

coloca o papel Buyer 

em JACK 1 eo perfil 

objecto em CAR 18 

(P1 isa PURCHASE with 

[Buyer JACK 1] 
[Seller Seller (P1)] 
[Object CAR 18]) 


Ao longo destes exemplos evidenciou-se a questão 
central da representação do conhecimento do significado 
de uma frase de entrada de um sistema 
pergunta-resposta, tendo em vista a selecção de uma 
resposta adequada, a qual pode ser realizada em dois 
passos sucessivos: 


1) resposta à pergunta como procura na base de 

dados, e 

2) geração de uma resposta que ajudará melhor o 
objectivo do utilizador, nomeadamente para: 

- antecipar as suas próximas acções, por 
exemplo realizar um acto que ocorreria 
posteriormente embora não tivesse ainda sido 
explicitado, e 

- inspecionar os planos reconhecidos em busca 
de obstáculos, isto é as partes do plano que o 
utilizador não seria capaz de realizar por falta 
de conhecimento ou por causa de crenças 
erradas. 


3. Diálogos interactivos 


Nas conversas ordinárias de todos os dias, os 
participantes fazem hipóteses sobre o conhecimento que 
vão trocando, assinalam as suas hipóteses através das 
pressuposições pragmáticas das suas frases, e negoceiam 
incompreensões sobre o conhecimento mútuo que vão 
desenvolvendo. Tudo isto é feito de modo rotineiro com o 
bom senso e através de maquinarias que não conhecemos 
ainda com rigor. Sabemos apenas que as conversas se 
constroem perante um conjunto de fenómenos do 
discurso, os quais podem ser simples e complexos, como 
em seguida se enumeram na figura 13. 

Ao ensaiarmos resolver a compreensão de um 
discurso/conversa temos de entrar em linha de conta não 
só com aqueles fenómenos, mas também com uma 
grande variedade de aspectos, dos quais se destacam os 
seguintes: 


Helder Coelho 


- ELIPSES 


SIMPLES 
- ANÁFORAS 


- SINTAGMAS NOMINAIS DEFINIDOS 


- FRASES EXTRAGRAMATICAIS 
- FRASES METALINGUÍSTICAS 
- ACTOS DE DISCURSO INDIRECTO 


figura 13 - Fenômenos do discurso 


COMPLEXOS 


e unidades de significado dependentes e não isoladas 
e contexto: e colocação das frases no mundo real 
e ligação linguística entre frases 
eregras da estrutura do discurso: como as frases 
podem ser combinadas para constituir diálogos 
epapel do conhecimento de senso comum para 
derivar relações semânticas entre constituintes do 
diálogo 
e procura de intenções e propósitos das frases 


Daqui, pode-se concluir que existem quatro aspectos 
fundamentais que devemos abordar de modo mais 
profundo quando pretendemos automatizar os diálogos 
interactivos: a estrutura do discurso, a semântica do 
discurso, os actos de discurso e pragmática, e as 
modalidades de entrada/saída. 


3.1 Estrutura do discurso 


À compreensão da estrutura do discurso/conversa 
envolve os seguintes objectivos: 


e Compreender as relações entre as suas partes, 
- frases 
- Segmentos/cursos 
- monólogos 
- explicações 
- diálogos 
- tácticas: trocas 
- estratégias/planos 


e A estrutura do discurso afecta a interpretação 
das frases individuais: define o contexto 
semântico que pode ser invocado para determinar 
a interpretação de um pronome, uma descrição 
definida ou um termo descritivo. 


e Métodos para determinar a estrutura do 
discurso que estão associados à compreensão de 
estruturas linguísticas e retóricas: 

- mecanismos sintácticos de narrativa 

- semântica e sintaxe das frases 

- sequências pergunta/resposta 

- operadores de discurso (OK, sim, não, está bem) 
- convenções de divertimento 

- encaixe de discursos e convenções de retorno 


Recentemente, as linhas de 
desenvolvem-se em duas frentes: 


investigação 


capturar o significado, ou as relações de 
coerência entre cláusulas e segmentos, as quais 
funcionam em conjunto para comunicar ideias 


Técnica - 90 13 


Situação Científica sobre a Compreensão da Língua Natural 


interligadas (Hobbs, 1979 e 1985; Mann e 
Thompson, 1983) 


compreender as relações estruturais em 
discursos não coerentes, os quais são dominados 
por interrupções, hesitações, etc. 

(Reichman, 1981 - Teoria do espaço do contexto, 
Grosz e Sindner, 1986 - Teoria das estruturas do 
discurso, Polanyi e Scha, 1984 - Modelo do 
discurso dinâmico) 


3.2 Semântica do discurso 


Quanto à semântica do discurso, existe uma tese que 
orienta actualmente os trabalhos de investigação. 


TESE: as condições de verdade de uma frase podem 
ser descritas matemáticamente como uma 
função de estados em valores da verdade 


Existem várias operações relacionadas com o 
processamento de uma frase num discurso, a saber: 

e determinar o significado da frase no contexto, 

eintegrar o significado da frase com o significado do 
discurso, e 

eactualizar o contexto que será usado para 
interpretar a próxima frase. 

A interpretação de uma frase pode ser alcançada 
através da inferência dos objectivos conversacionais, e 
dos papeis sociais dos participantes. No entanto, é 
necessário recorrer a regras de expectativa sobre o 
discurso, tais como aquelas que: 

- operam nos níveis sintáctico, semântico e 
pragmático para resolver problemas linguísticos, 
como a elipse, e as que 

- permitem focar a atenção do sistema sobre o 
diálogo. 


3.3 Actos de discurso e pragmática 


Quanto aos actos de discurso e pragmática 
defrontam-se neste momento duas linhas de 
investigação exemplificadas na figura 14. 


UTILIZAR AS 
PALAVRAS PARA af 
FAZER COISAS 


AS PALAVRAS 
REFEREM-SE A 
PALAVRAS 


(Strawson 1950; 
Austin, 1962; 
Searte, 1969) 


Linguagem €C Teoria da Acção 


LINGUAGEM = CÓDIGO 
(PRAGMÁTICA) 


figura 14 - Alternativas de trabalho pragmático 


Às teses em presença são as seguintes: 


1) O significado de uma mensagem linguística é 
apenas representado pelo conteúdo. 

2) A atribuição de intenções ao falante deve ser 
uma parte integral do processo de compreensão 
do ouvinte. 

3) Uma teoria de compreensão da linguagem 
deve determinar até que ponto as estratégias que 


as pessoas usam para chegar a explicações 
satisfatórias do comportamento físico dos outros 
podem ser empregues na compreensão dos actos 
de discurso. 


Compreender o discurso requer inferir intenções e 
crenças que conduzem o locutor a produzir um 
comportamento. E, em geral, a comunicação em LN 
envolve muito mais do que responder a perguntas 
isoladas. O recurso ao contexto é de facto fundamental, 
como se indica na figura 15. 

e INFORMAÇÃO TROCADA 

DURANTE O DIÁLOGO 


e CONHECIMENTO DO 
DOMÍNIO 


MODELO DO 
CONTEXTO 


MODELO DO 
UTILIZADOR 


FAZER HIPÓTESES SOBRE 


| 3 O MODELO DO FALANTE 


Figura 15 - Modelos 


Eis algumas das linhas de investigação empreendidas 
desde 1980: 


e compreender actos indirectos 
(Perraut, 1980) 
e fornecer respostas que ajudem 

(Allen,1980) 
e interpretar perguntas mal formadas 

(Carberry,1986) 
e compreender elipses entre frases 

(Allen, 1980; 

Carberry, 1985) | 
e identificar o tipo de respostas pretendido 

(Sidner, 1983) 


A modelação do conteúdo de uma conversa/história é 
feita basicamente através de duas vias, indicadas na 
figura 16, | 


MODELOS 
BASEADOS EM |: 
PLANOS | 
(Allen & 
Perrault, 1980) 


era cer ree 


(Schank & Abelson, 1977) 


GUIÕES 


Figura 16- Modelação da conversa 


as quais podem ser resumidas através de três aspectos: 


Características: 
nada de não habitual ocorre coisas não esperadas 
ocorrem 
Representação: 
baseada em acções baseada em acções 
Processamento: 
associação de padrões composição do plano 
com sub-planos 
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Em resumo, em oposição estão: 


GRANDES contra PEQUENAS ACÇÕES 
DESCRIÇÕES + SISTEMA GERAL 
DE RACIOCÍNIO 


para agrupar as acções 
em estruturas de 
planos 


Uma língua não pode ser completamente 
compreendida sem o recurso ao conhecimento de todos os 
dias que os falantes têm acerca do mundo. Para 
conversar um sistema deve compreender as ligações 
entre pares de frases e tirar conclusões adequadas. É, dai 
a necessidade de recorrer às crenças dos agentes em 
presença. Logo, as representações do conhecimento 
devem ter capacidades para incluir crenças. À distinção 
dos diferentes significados pretendidos é feita recorrendo 
aos modelos de crenças, onde se insere a informação 
sobre o que o falante/agente acredita. Existem várias 
representações possíveis: 


1) Etiquetar cada facto da BC com o nome do agente 
que acredita nesse facto. 

2) Dividir a BC em bases separadas, designadas por 
espaços de crença, cada uma representando um 
conjunto de crenças de um agente particular. 

3) Cada espaço de crenças inclui diferentes acções e 
estruturas de planos de forma a contemplar os 
planos individuais dos agentes, com: 

- crenças encastradas 
crenças mútuas/partilhadas 

- crenças sobre os conhecimentos e 
habilidades dos outros 


A comunicação é modelada de diversos modos, entre 
os quais se realçam os trabalhos pelos seguintes autores: 


(Grice,1957; Austin,1962; Searle,1969) 
(Cohen & Perrault,1979; Allen & Perrault,1980) 
(Grosz & Sidner,1986; Litman & Allen,1987) 


A identificação do significado pretendido numa 
conversa é o objectivo a alcançar, como se indica na 
figura 17. 


ACTOS DE DISCURSO Dr 


PLANEAR 


RECONHECER 
PLANOS 


FORÇA 
ILOCUTÓRIA 


CONTEÚDO 
PROPOSIONAL 


figura 17 - Identificação do significado 


A definição das circunstâncias apropriadas sob as 
quais são realizados os actos do discurso dependem das 
condições sobre as crenças e intenções do falante e do 
conhecimento sobre as convenções da linguagem. 
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Os modelos de diálogo do utilizador que actualmente 
estão disponíveis são: 


* Conteúdos Apropriados 
' Técnicas de Construção 
Estratégias para Racionar 
na Compreensão e 
Geração dos Diálogos em 
L 


DIRECÇÕES DE 


DOS MODELOS 
INVESTIGAÇÃO 


Sistemas Gerais 
(Transportáveis) 


figura 18 - Modelos de dialogo 
Vejamos, a título de exemplo, alguns dos projectos em 
curso na RFA que abordam a temática dos actos de 
discurso: 
- HAM-ANS: HAMBURG APPLICATION - oriented 
NATURAL LANGUAGE SYSTEM 
- sistema de reserva de hoteis 
- sistema de análise de sequências de 
imagens 
- sistema de BD relacionais 
- XTRA: EXPERT TRANSLATOR 
- preenchimento de impressos de 
impostos 
: VISUAL TRANSLATOR 
- interface para um sistema de visão 
- SC : SINIX CONSULTANT 
- sistema de ajuda em LN para a 
SINIX 
- WISBER : Wisenbarierter Beratungsdialog 
- Sistema para consulta financeira 


3.4 Modalidades de entrada/saída 


As modalidades de entrada/saída de um sistema de 
compreensão da LN podem desdobrar-se do modo 
seguinte: 


- VITRA 


1) Oral vs. escrita 

2) Grau de interacção 

3) Frequência espacial 

4) Frequência temporal 

5) Possibilidade de comunicação para a 
linguística 

6) Referentes concretos 

7) Especificidade da audiência 

8) Separação dos participantes 


Obviamente, cada sistema sobredetermina apenas 
uma ou algumas destas modalidades, diminuindo assim 
as dificuldades de automatização dos aspectos 
subjacentes, 


4 - Problemas da LN em investigação 


A análise das Actas das últimas Conferências 
Internacionais sobre Linguistica Computacional 
(COLING 86, Bona) e Inteligência Artificial (IJCAI 87, 
Milão) permite agrupar as áreas onde se trabalha mais 
intensamente. 
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No campo da Linguística Computacional, as áreas 
são: a semântica, os diálogos, a gramática, o software, a 
tradução automatizada, a descrição/análise, o 
conhecimento, a morfologia, a geração e o discurso. No 
campo da Inteligência Artificial estas áreas estão 
também presentes e os problemas em investigação 
podem-se destacar de uma lista exaustiva: 


- Problemas principais 


Desambiguação do sentido das palavras 
descrição/análise, verificação da consistência do 
discurso, resolução de termos equívocos, resolução da 
anáfora, violação de constrições categoriais entre 
predicados e argumentos, construção de acordos 
(referências), e geração incremental de frases. 


- Problemas secundários 


Construção dinâmica do modelo de uma tarefa/plano, 
reconhecimento de planos em situações, erro de 
comunicação em referência, classificação dos diálogos 
por negociação, coordenação da compreensão de diversos 
tipos de discurso incluindo pedaços de informação cujo 
nível de granularidade é diferente, modelação dinâmica 
do uso da língua, ajuste das descrições dos objectos do 
conhecimento do utilizador, reparação do modelo do 
utilizador face à disparidade de planos, selecção de 
guiões, e manutenção do estado corrente do guião 
revelante. 

A título de exemplo, seleccionemos a parte da 
compreensão de LN do projecto japonês da quinta 
geração, e vejamos através da sua situação em 1987 
como alguns daqueles problemas estão presentes. 

As direcções de trabalho apontavam para os seguintes 
objectivos: 


1) Sistema para a compreensão do discurso (DUALS) 

2) Caixa de ferramentas para a linguagem (LTB) 

3) Gramática de estruturas sintagmáticas 
generalizadas japonesas (JPSG) 


O caminho de investigação japonês procura desde o 
início encontrar respostas para a seguinte questão 
central: 


Pergunta: O que é compreender uma LN? 


através da realização de um sistema concreto, 
denominado DUALSI, e com as seguintes 
características: 


1984 : DUALSI 


e análise sintáctica com BUP ("Bottom-up 
parser”) 

e análise de contexto com identificação de 
objectos baseada em Prolog (resolução das 
elipses e anáforas) 

e análise de discursos 

e resolução de problemas com fins específicos 


e escrito em LFG ("Lexical Functional 
Grammar") e CIL ("Complex Indeterminate 
Language"""Situation Semantics Theory") 

e baseado no paradigma da programação 
lógica 


Os principais passos da evolução do projecto japonês, 
no que respeita a compreensão da LN, são os seguintes: 


Processamento em 

paralelo para a | 
Análise Sintáctica | 
figura 19 - Evolução do DUALSI 


("Sequential Analyser of 
Sytax and Semantics”) 


Também aqui neste projecto de investigação se nota 
uma tendência de fazer convergir três formalismos 
gramaticais num único formalismo, o CIL: 


LFG 
GPSG > 
HG 


CIL 


e o argumento principal para uma tal fusão baseia-se na 
articulação de vários formalismos gramaticais baseados 
na unificação. 


Do ponto de vista das teorias da LN adoptadas 
destacam-se as seguintes: 


ACTOS DO DISCURSO 
PLANOS-OBJECTIVO 
CÁLCULOS DE EVENTOS 
ESTRUTURAS DE 
DISCURSO/SITUAÇÕES 


que estão sendo trabalhadas, de forma a serem 
posteriormente integradas. 


A questão fundamental da investigação japonesa 
consiste em descobrir como organizar estas teorias de 
forma a que elas cooperem entre si. O objectivo imediato 
traduz-se em como organizar a estrutura do discurso com 
a Teoria das Situações, isto é como mudar a estrutura 
complexa do discurso em uma estrutura do topo para 
base. É, o objectivo futuro desdobra-se em várias tarefas: 
dicionários de grandes dimensões (centenas de milhares 
de palavras), compreensão do falante (quem fala), 
compreensão das referências e condução de raciocinio de 
senso comum. À esperança dos investigadores japoneses 
baseia-se no amadurecimento da Teoria dos Discursos. 
Deve-se ressaltar que algumas destas tarefas estão 
também a serem resolvidas num outro programa de 
investigação ambicioso, o da MCI nos EUA. 

interessante observar que no projecto japonês se 
podem observar algumas das grandes questões da 
investigação actual a nível internacional. Eis uma 
delas: 
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Pergunta: Em que nível podemos afirmar que 
finalmente atingimos a compreensão da LN? 


| Ê Compree nsão 
= a E: 
CIL do Discurso 
| baixo poder 7 
| descritivo F 
NY 


E Ê 

: Vários níveis 

: aatravessár 

: pois o discurso tem 
: várias cónstrições 


FI) 
; 
; 
4 
Pacote biblioteca 
usando CIL 


DESCRIÇÃO CEEE o > COMPREENSÃO 
| Figura 20 - Em direcção à compreensão 


Os japoneses trabalham assim no espaço entre a 
descrição e a compreensão total, e tentam avançar 
algumas ideias numa tentativa de obter respostas para 


aquela pergunta. 


5 - Aplicações da LN 


O campo de aplicação da compreensão da LN é 
multifacetado, sendo a geração de interfaces bastante 
popular para a construção e engenharia de diversos 
sistemas: 


e sistemas de gestão de bases de dados 

e sistema de apoio à decisão 

e sistemas periciais e outros baseados em 
conhecimento 

pacotes gráficos 

sistemas tutores inteligentes 

sistemas pergunta/resposta 

sistemas de ajuda inteligentes 


No caso das interfaces dos Sistemas de Gestão de 
Bases de Dados (SGBD's) há uma visão simplista do 
contexto. Existe uma base de dados fixa com 
conhecimentos que não mudam, e a interpretação de 
qualquer base é virtualmente das frases precedentes. 
Quer isto dizer, que não existe contexto conversacional 
de facto. 

A elaboração de sistemas pergunta/resposta, quer 
para os SGBD's ou para os sistemas tutores, é um 
domínio privilegiado para se estudarem os aspectos 
básicos em compreensão e geração de LN. De facto, ao 
abordarem-se os tipos de perguntas, estamos a estudar o 
apoio à interacção através da geração de outros tipos de 
respostas, tais como respostas correctas, respostas úteis, 
respostas que não enganem, e respostas indirectas. 


Helder Coelho 


O estudo do apoio à interacção passa também pela 
compreensão de diversas funções, tais como a definição 
de termos, as paráfrases, a correcção de equívocos, e a 
modificação de perguntas. 

As interfaces espertas permitem aumentar a 
tolerância aos erros de dactilografia (ou de pronúncia) e 
às divergências gramaticais. Donde, a necessidade de 
capacidade de reparação de erros! 

Vejamos a definição de termos, onde se pretende 
atingir a adaptação à terminologia do utilizador, quer 
através da aquisição de informação ou da geração de 
explicações. 


Existem quatro métodos: 


1) O utilizador equaciona o novo termo ou 
reconstrói-o com termos já conhecidos pelo 
sistema; 


2) O utilizador é guiado passo a passo através de 
um processo de definição capaz de fornecer ao 
sistema informação sintáctica e semântica 
acerca do novo termo; 


3) O sistema assume que o termo desconhecido é 
um valor da base de dados, e espera pelo 
resultado da procura; 


4) O utilizador é solicitado a escrever de novo o seu 
pedido com outros termos. 


E a investigação actual espraia-se em três direcções: 


- adaptar as definições ao contexto do discurso 
corrente, 
adaptar as definições ao conhecimento e/ou aos 
objectivos prévios do utilizador,e 
recorrer tanto a imagens como a textos. 


No que respeita a aquisição do conhecimento, 
destacam-se neste momento três direcções de trabalho, a 
saber: 


Verbos (Grosz et al, 1987) 
Campos de aspectos  (Groszet al, 1987) 
Regras de gramática  (Viccari, 1987) 


ao longo de dois projectos, um nos EUA e outro em 
Portugal: 


projecto TEAM (Grosz, Appelt, Martin, 
Pereira, 1987) 
projecto LNEC (Viccari, 1987) 


A motivação destes objectos é a obtensão de maior 
flexibilidade das interfaces, e o domínio dos processos de: 


- | geração de perguntas, e de 
- extracção de informação sintáctica e 
semântica das respostas. 


Numa conversa a maior parte das dificuldades 
provêm do facto dos participantes terem visões 
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diferentes acerca do mundo, e ou não descrevem este 
facto, ou falham alguma coisa contra isso. Daí, o 
aparecimento de equívocos (disparidades entre as 
crenças dos dois participantes) e a necessidade de os 
corrigir. 

O objectivo desta correcção consiste na identificação e 
na reparação dos equívocos. 


Exemplos de sistemas já construidos: 
Co-OP (Kaplan, 1982) 


(Mercer, 1984) 
(Gal & Minker, 1985) 


O estado da arte da construção de interfaces pode 
resumir-se ao longo de dois aspectos dominantes: 


para fins específicos: 


- Dificuldade ou mesmo impossibilidade de serem 
feitas alterações significativas ao sistema por 
alguém que não seja projectista. 

- Duração de construção: de dois meses a cinco 
anos para os programadores experientes. 


para fins gerais: 


- | Tempo de desenvolvimento muito longo (alguns 
anos) para produzir componentes independentes 
do domínio. 

- Esforço de aplicação a um domínio particular: 
semanas ou meses. 


Vejamos alguns exemplos de produtos desenvolvidos 
ao longo dos últimos dez anos. Em interfaces de LN para 
bases de dados, LUNAR, REQUEST, TQA, REL, 
PLANES, NL MENU SYSTEM, EXPLORER e RUS. E, 
no que respeita os produtos comerciais, destacam-se 
INTELLECT, THEMES, RAMIS, CLOUT, PLUME e 
EXPLORER. 

Os tutores inteligentes é uma área de aplicação da IA 
onde se torna necessário a aprendizagem da língua 
natural, para que eles se comportem inteligentemente 
quando dialogam com os seus alunos, quer através da 
análise das suas frases ou da geração de respostas ou de 
perguntas adequadas. Ora, aprender uma língua é uma 
tarefa necessária para estudar como se interactua numa 
língua, pois isto implica simultaneamente resolver três 
problemas, nomeadamente a análise gramatical, as 
interpretações semânticas e pragmáticas, e o raciocínio 
sobre os objectivos dos alunos. Estes problemas que se 
encontram ligados entre si, jazem no seio dos temas 
processamento e língua natural e projectam-se contra o 
espaço referencial da representação do conhecimento, 
pois da selecção de um formalismo depende em grande 
parte a procura das melhores soluções para construir 
sistemas capazes de conversar com os seres humanos. 

Finalmente, a participação activa dos sistemas em 
diálogo com os seus utilizadores depende 
fundamentalmente não só de maiores conhecimentos 
linguísticos de ordem sintáctica-semântica, mas 
também de ordem pragmática, os quais se situam fora do 


contexto do trabalho em IA. Com eles, e com a 
participação e colaboração de linguístas, filósofos, 
psicólogos e informáticos o progresso será mais forte. Em 
Portugal, não tem sido fácil até agora congregar estes 
esforços. O exemplo do ILTEC (Instituto de Linguística 
Teórica e Computacional) é encorajador. 


6 - Conclusão 


Os aspectos que se encontram correntemente em 
investigação em LN são: semântica formal, 
reconstrução lógica, descrição gramatical como dedução, 
negação e disjunção, complexidade gerativa forte, 
unificação de termos vs. grafos, sistemas categóricos 
combinatórios, partilha de estrutura, restrição e 
dispositivos não monotónicos. Mas, são os aspectos da 
descrição gramatical em paralelo e das formas de 
organização do léxico que se constituem como 
merecedores de grande atenção, pois da sua cabal 
resolução poderão surgir progressos nesta área, 

O estado da arte da compreensão da LN em 1987 pode 
ser sintetizada ao longo dos seguintes vectores: 


e necessidade de grandes quantidades de 
conhecimento do mundo real 
novos formalismos de representação 
novas técnicas de inferência para 
desambiguar as frases 
novas organizações de memória 
- | novos modos de codificação 
A IA não atingiu ainda o estádio em que 
consegue manipular de forma rotineira o 
conhecimento necessário! Daí, a variedade 
de sistemas piloto ou de protótipos com um 
subconjunto de LN e com poucos exemplos de 
demonstração... 


e necessidade de capacidade de aquisição de 
conhecimento 


o sistema deve ter uma grande quantidade 
de conhecimento antes de começar a 
aprender 


e necessidade de aprendizagem da LN pelos 
sistemas que conversam 

e necessidade de capacidade de detecção e 
resolução dos erros e das incompreensões do 
utilizador 

e necessidade de analisar cada domínio de 
aplicação para pré-codificar inferências 
específicas. 


Em Portugal, os trabalhos de investigação sobre 
compreensão da LN iniciaram-se em 1976 no Centro de 
Informática do LNEC, em redor de Luís Moniz Pereira e 
Helder Coelho. Actualmente, estes trabalhos 
prosseguem através de projectos autónomos no INESC, 
na UNL e na FCUP. 
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RESUMO 
Para uma aplicação correcta dos modelos existentes de 
propagação de fogos às condições portuguesas, é 
necessário obter informação sobre as características de 
queima dos combustíveis florestais mais correntes em 
Portugal, que permita fazer as necessárias adaptações 
ao sub-modelo do combustível constante desses 
modelos. É este o objectivo de um projecto em curso no 
Departamento de Engenharia Mecânica do IST. 
O presente trabalho descreve a instalação e 
instrumentação utilizada e mostra alguns resultados 
obtidos nesta área. Foram feitos ensaios de queima de 
leitos de agulhas de pinheiro, com vento transversal e 
sem vento. Foram medidas velocidades de propagação 
do fogo, taxas de diminuição do peso do combustivel e 
temperaturas atingidas. Os ensaios foram gravados 
em vídeo e por análise da imagem foi possível obter 
informação sobre a geometria da chama (altura, 
inclinação e comprimento de chama). Os parâmetros 
usados foram a velocidade do vento e a humidade do 
combustível. Sempre que possível, os resultados 
obtidos são comparados com resultados existentes na 
literatura. 


1- INTRODUÇÃO 


A área florestal total do país tem actualmente uma 
extensão de cerca de 3 milhões de hectares, dos quais 1,3 
milhões são de pinheiro bravo (cerca de 45%). A 
exportação de produtos provenientes da floresta 
representa cerca de 20% do valor global das nossas 
exportações e calcula-se que a mão-de-obra empregue no 
sector florestal é da ordem dos 100 000 trabalhadores, 
isto é, cerca de 2,5% da população activa. 

Da área total indicada, cerca de 75% corresponde a 
propriedade privada. Dado um número total de quase 
400 000 explorações, a área média por exploração é 
reduzida (5,7 ha). 

Desde 1974 foram destruidos pelo fogo mais de 300 
000 hectares de matas, o que corresponde a cerca de 10% 
da área florestal total [1]. 


Nota: O presente artigo constitui uma versão revista da comunicação 
com o mesmo título apresentada às Jornadas Científicas sobre 
incêndios Florestais, realizadas em Coimbra, de 23 a 25 de 
Novembro de 1988. 
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ABSTRACT 


In order to apply in a correct way the existing models 
of fire propagation to the portuguese conditions, 
information is needed on the burning characteristics of 
the forest fuels most common in Portugal, to allow the 
fuel sub-model to be adapted (if necessary). This is the 
main objective of a project under way at the 
Mechanical Engineering Department, IST. 

The present paper describes the experimental set and 
instrumentation used and shows some results of the 
work. Beds of pine needles were burned, both in 
crosswind and in still air. Fire propagation velocities, 
fuel weight loss rates and temperatures were 
measured. The experiments were video recorded and, 
from image analysis, information on flame geometry 
(flame height, angle with the vertical and flame 
length) was obtained. Input parameters were wind 
speed and fuel moisture. Whenever possible, results 
are compared with data in the literature. 


A problemática dos fogos florestais no nosso país tem 
de ser colocada no contexto dos números reproduzidos 
acima. Enquanto em paises como os E.U.A. a gestão das 
florestas prevê zonas onde fogos que tenham início em 
causas naturais são deixados arder livremente (desde 
sempre as florestas viveram em equilíbrio com os 
incêndios naturais), em Portugal, dada a escassez dos 
nossos recursos, tal atitude seria impensável". 

Dois dos parâmetros mais importantes para 
caracterizar um fogo florestal, com relevância quer nas 
operações de combate ao fogo, quer nas consequências do 
fogo (destruição directa e consequências ecológicas a 
mais longo prazo) são a velocidade de propagação e a 
intensidade do fogo. Têm sido desenvolvidos vários 
modelos para descrever o comportamento do fogo e em 
particular prever, em condições dadas, os valores 
daqueles dois parâmetros. 

Sendo o fogo, e em particular o fogo florestal, um 
fenómeno extremamente complexo, quer na sua 


Mesmo nos E.U.A., existe alguma controvérsia neste campo, 
nomeadamente quando a extensão ardida é grande. Veja-se a 
discussão havida em relação ao incêndio que no Verão de 1988 
cobriu cerca de 400 000 hectares do Parque Nacional] de 
Yellowstone. 
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figura 1 - Vista geral da instalação utilizada. 


estrutura físico-química, quer na forma como é 
influenciado pelas condições ambientais, não é de 
estranhar que os modelos existentes simplifiquem certas 
características do fogo, afim de tornar o problema 
tratável. Fons [2], Hottel [3], Anderson [4], Frandsen [5] 
e Rothermel [6], [7] são alguns dos autores cujos modelos 
se podem encontrar na literatura. De todos estes, é 
provavelmente o modelo de Rothermel o mais conhecido; 
indo buscar a sua expressão para a velocidade de 
propagação ao modelo de Frandsen, transforma-a depois 
introduzindo novos termos que, baseados em resultados 
experimentais, vem a possibilitar a solução aproximada 
da referida equação. Enquanto o modelo de Frandsen é 
um modelo analítico, o modelo de Rothermel é 
semi-empírico, ele tem sido no entanto amplamente 
testado nos E .U.A., sendo o modelo incorporado no 
programa BEHAVE, documentado em Andrews [8] e 
Burgan e Rothermel [9]. 


2- INSTALAÇÃO EXPERIMENTAL E 
INSTRUMENTAÇÃO UTILIZADA 


A figura 1 mostra a instalação experimental utilizada 
no presente trabalho. Colocada à saída da câmara de 
estabilização de um túnel aerodinâmico (1,20m x 0,90m) 
existe uma mesa (2,66m x 1,32m) com uma abertura 
rectangular na qual está posicionado um tabuleiro de 
alumínio (1,40m x 0,5m) que, por meio de uma estrutura 
recticulada, assenta sobre o prato de uma balança com 
saída digital. 

Sobre a mesa dispuseram-se alguns obstáculos 
(pequenas pedras) destinadas a simular a rugosidade 
existente no terreno em condições reais. No tabuleiro é 
espalhada uma camada de areia sobre a qual é 
preparado o leito de combustível. O combustível é 
inflamado na extremidade do tabuleiro mais próxima da 
saída do túnel (uma pequena calha com álcool serve de 
fonte de ignição) e é observada a propagação do fogo ao 
longo do tabuleiro. 


A balança (Mettler PE11) mede o peso do tabuleiro ao 
longo do tempo e o sinal produzido, à taxa de 4 valores 
por segundo, é adquirido por um computador HP Vectra, 
onde fica armazenado para posterior processamento. Ao 
longo do tabuleiro, em pontos pré-determinados, são 
colocados conjuntos de três termopares (Pt/Pt - 13% Rh), 
a alturas diferentes, para permitir obter temperaturas 
na camada de areia, no leito de combustível e 
imediatamente acima deste. À figura 2 mostra o desenho 
esquemático de um desses conjuntos. 
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figura 2 - Desenho esquemático do conjunto de termopares para 
medição de temperaturas. 


Posicionada lateralmente em relação ao tabuleiro 
(canto inferior direito na figura 1) é colocada uma 
câmara de vídeo (Canon VM-E1), que permite registar a 
propagação do fogo do início ao fim do tabuleiro, 
inserindo na imagem o registo do tempo medido por um 
cronómetro digital. Filmando a propagação do fogo 
contra um painel quadriculado, é possível obter, por 
análise posterior da gravação num monitor, informação 
detalhada sobre a geometria da chama (altura, 
comprimento e inclinação da chama) e velocidade de 
propagação. 

Foram feitas experiências com diversos tipos de 
agulhas de pinheiro: Pinus pinea, Pinus halepensis e 
Pinus canariensis. O presente artigo apenas contém 
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resultados obtidos com agulhas desta última espécie 
(pinheiro das Canárias). 


3- RESULTADOS E DISCUSSÃO 


Todos os ensaios aqui relatados foram conduzidos 
para uma mesma carga de combustível de 550 g/m*, 
sendo a altura aproximada do leito de combustível 5 cm e 
para três valores diferentes da humidade do combustivel 
(peso de água sobre peso de combustível seco): 0%, 7,9% e 
18,1%. 

A figura 3 apresenta resultados típicos da variação do 
peso do tabuleiro em função do tempo. Identificada a 
zona linear da curva, o respectivo declive dá a taxa de 
perda de peso que nos presentes ensaios, com velocidades 
do vento relativamente baixas, corresponde 
essencialmente à taxa de libertação de voláteis, que por 
sua vez é proporcional à potência calorífica libertada 
pelo fogo. Para velocidades do vento muito maiores, os 
resultados da perda de peso virão falseados, pois vai 
ocorrer o arrastamento de partículas de cinza (e 
eventualmente de partículas de combustível mais leves) 
pelo vento. 


m C=.55kg/mn'? U=.Bm/s Hc=iB.1X 


-[4 


Ú 50 100 


) eso 300 350 ano 


“TEMPO [seg 
figura 3 - Variação do peso do tabuleiro em função do tempo. 

Para a medição de temperaturas, um registador 
(YEW modelo 3087) recebia o sinal proveniente dos 
termopares, sendo o intervalo de tempo entre duas 
temperaturas medidas pelo mesmo termopar de 5 
segundos. A figura 4 mostra um exemplo dessas 
medições. Para maior clareza, o gráfico apenas 
apresenta as evoluções de temperatura no primeiro 
grupo de termopares (as evoluções nas outras duas 
estações de medição são muito semelhantes). Pode 
observar-se que o termopar 3 -- acima da superficie do 
leito -- é o que atinge uma temperatura mais elevada, 
uma vez que fica em contacto directo com a chama, e é 
também aquele cuja temperatura aumenta em primeiro 
lugar, pois recebe calor da frente de chama por 
convecção e radiação. Além disso é o primeiro a diminuir 
de temperatura, visto que após a passagem da chama 
fica imediatamente a ser arrefecido por convecção. 

A temperatura registada pelo termopar 2 -- dentro do 
leito de combustível -- aumenta menos e esse aumento 
tem início mais tarde, porque ele só pode receber calor da 
chama por condução através do leito (poderá haver 


algum calor transmitido por convecção e radiação, mas 
em quantidade muito menor). 


Tic) 
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- 400 
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tiseg) 
figura 4 - Evolução da temperatura em cada um dos termopares da 


primeira estação de medição. 


Finalmente o termopar 1, inserido na camada de 
areia, só pode receber calor por condução a partir da 
superficie; a onda de temperatura atinge-o portanto em 
último lugar e o valor atingido é muito mais baixo. 

Note-se também a diferença nas temperaturas 
registadas após a passagem do fogo: o termopar 3 
regressa rapidamente à temperatura ambiente, o 
termopar 2 fica a uma temperatura um pouco acima, que 
é a temperatura das cinzas e que irá diminuindo à 
medida que estas forem arrefecendo. O termopar 3 é o 
que fica a uma temperatura mais elevada, a areia 
arrefece mais lentamente do que o leito de combustível. 

Na figura 5 pode ver-se a taxa de variação de massa 
em função da velocidade do vento, usando como 
parâmetro a humidade do combustível. Verifica-se que 
para a mesma velocidade do vento, a taxa de perda de 
massa diminui com o aumento de humidade. Para uma 
dada humidade, m aumenta com a velocidade do vento, 
embora os resultados sugiram que esse aumento é menos 
acentuado quando a humidade do combustível é maior. 

A influência da humidade na velocidade de 
propagação da chama pode observar-se na figura 6. 
Verifica-se que a velocidade de propagação diminui com 
o aumento de humidade do combustível, e que para a 
mesma humidade, a velocidade de propagação aumenta 
com a velocidade do vento. O carácter basicamente 
linear da relação encontra-se já documentado, por 
exemplo em [10] e [11], embora como é sugerido na 
figura 7 de [4], as linhas tenham que vir a afastar-se da 
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figura 5 - Taxa de variação de peso em função da velocidade do vento 
para três valores da humidade do combustivel. 
linearidade para encontrar o eixo das abcissas no valor 


da humidade de extinção. 
037— 


dd C= 55kg/m 2 UsQm/s 
O C=55Kg/n'?2 U=-.8m/s 
O [= 55kg/n'? U=1.8m/s 


Ug- 


Im/5] 


VD 


01 


o Ti 20 0 
He lX) 


figura 6 - Velocidade de propagação do fogo em função da humidade 
do combustivel, para três valores da velocidade do vento. 


A relação entre a velocidade de propagação do fogo e a 
velocidade do vento está representada na figura 7. 
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figura 7 - Velocidade de propagação do fogo em função da velocidade 
do vento, para três valores da humidade do combustivel. 

A forma destas curvas é discutida em [11], onde se 
conclui ser ela uma função da razão superficie/volume 
das partículas de combustível e da porosidade do leito. 
Para combustíveis finos, como é o presente caso, o 
declive das curvas aumentaria com a velocidade do 
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vento. À figura 8 apresenta resultados publicados que 
confirmam esse andamento das curvas; pode ver-se 
também desta figura que os resultados do presente 
trabalho estão numa gama de velocidades do vento em 
que a variação é muito próxima de linear. 

O comprimento de chama é um parâmetro com 
interesse na caracterização do fogo porque pode ser 
relacionada com a intensidade do fogo (potência 
calorífica por unidade de comprimento da linha de fogo) 
através da fórmula de Byram [12] 


L = 0,0775]“ (1) 


com Lem melem kW/m. 
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figura 8 - Velocidade de propagação do fogo em função da velocidade 
do vento. Simbolos cheios: presente trabalho; simbolos abertos: [11]. 


A figura 9 mostra que o comprimento de chama é 
praticamente independente da velocidade do vento (pelo 
menos na gama de velocidades testada); Albini [13] 
discute razões para esta não dependência, com base na 
ordem de grandeza das variações da intensidade, 
velocidade de propagação e velocidade do vento. 


= - . 


da C=.55kg/m 2 He=D 
ED C-.5SkKg/n'? He=7.0 
O C=.55Kg/n'2 He=iB.1% 


im) 


+ 


0 2 


ES 


: bj Rr 

U (m/s) 

figura 9 - Comprimento da chama em função da velocidade do vento, 
para três valores da humidade do combustivel. 


A intensidade do fogo é igual ao produto da taxa de 
perda de massa (por unidade de comprimento da linha de 
fogo) pelo poder calorífico do combustível 


LE mn P 


Lo 


(2) 
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onde m vem em kg/(m.s)e P em kJ/kg. 

Tomando como um valor aproximado para o poder 
calorífico P = 20 000 kJ/kg, e substituindo I na fórmula 
de Byram, obtem-se 

L=7,375mº“ (3) 
expressão que nos dá o comprimento de chama em 
função da taxa de perda de massa por unidade de 
comprimento da linha de fogo. 

Na figura 10 pode observar-se a curva representativa 
da equação (3) em conjunto com o resultado dos 
presentes ensaios, bem como outros valores tirados da 
literatura. Não obstante uma certa dispersão dos 
resultados experimentais, a equação (3) descreve de 
forma satisfatória a tendência da evolução. 
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figura 10 - Comprimento da chama em função de mL (taxa de perda 
de peso por unidade de comprimento da linha de fogo). 


Um parâmetro muito utilizado na interpretação de 
resultados experimentais em fogos é o número de 
Froude. Definido através de 


(4) 


onde U é a velocidade do vento, g a aceleração da 
gravidade e H a altura da chama, o número de Froude 
pode ser interpretado como a razão entre a força de 
inércia do vento e a força de impulsão devida à chama, 
resultante da diferença de temperatura (e portanto de 
massa específica) em relação ao ar circundante. 

A figura 11 mostra a variação da velocidade de 
propagação com o nº de Froude, tendo como parâmetro a 
humidade do combustível. Parece haver uma tendência 
para a diminuição da influência do nº de Froude à 
medida que este aumenta, mas será necessário efectuar 
ensaios a nº de Froude mais elevados para o confirmar. 

Uma variável importante na propagação do fogo é o 
ângulo que a chama faz com a vertical; quanto maior for, 
maior é a quantidade de calor que incide por radiação 
sobre o combustível não queimado, secando-o e fazendo 
aumentar a sua temperatura. Rothermel e Anderson 
[11] representam graficamente a tangente desse ângulo 
em função de uma variável que definem como o 
quociente entre a energia do vento (por unidade de área 
normal à direcção do escoamento e por unidade de 
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figura 11 - Velocidade de propagação do fogo em função do n de 
Froude, para três valores da humidade do combustivel. 


tempo) e a energia libertada pelo fogo, por unidade de 
área da zona em combustão e por unidade de tempo. 
Usando escalas logarítmicas, a relação entre estas duas 
variáveis é uma recta. Como a variável utilizada por 
aqueles autores apresenta uma certa analogia com o nº 
de Froude (uma e outro são uma medida da importância 
relativa da força do vento e da força de impulsão devida 
à chama), representou-se na figura 12 a tangente do 
ângulo 6 (ângulo com a vertical) em função do nº de 
Froude. 


o NELSON É ADKINS Hes11% 
di CANARIAS He=0X 

BO CANARIAS He=7.9% 

O CANARIAS He=18.1% 
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figura 12 - Tangente de 6 (ângulo da chama com a vertical) em função 
do n de Froude. Simbolos cheios: presente trabalho; simbolos 
abertos: [14]. Linha a traço interrompido: Eq. (5); linha a cheio: Eq. 
(6). 

Os pontos representam medidas do presente trabalho 
e ainda de Nelson e Adkins [14]; a recta sobreposta a 


traço interrompido tem a equação 
U? 10,5 
gH 
deduzida por Albini [13], onde U é a velocidade do vento, 
g a aceleração da gravidade (9,8 m/s”) e H a altura de 
chama. Pode observar-se que esta recta não se ajusta de 
forma aceitável aos pontos representados. A recta 
representada a traço contínuo é resultante de um 
ajustamento por mínimos quadrados aos pontos 
representados. À equação é 

tan 6 = 0,999 Frº> 


tan60 = 1,22 | (5) 


(6) 
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Nelson e Adkins [14] concluem também que a Eq. (5) 
não se ajusta aos seus resultados e chegam à equação 


tan 6 = 0,89 Frº* (7) 


muito semelhante, como se verifica, à Eq. (6). 


4. CONCLUSÕES 


Foram apresentados resultados da combustão de 
resíduos florestais, utilizando parâmetros habituais na 
caracterização deste tipo de fogos. Foram efectuadas 
medições da velocidade de propagação do fogo, da taxa 
de perda de peso e das características geométricas da 
chama (comprimento, altura e inclinação). Onde 
apropriado, os resultados obtidos foram comparados com 
resultados existentes na literatura. 

O presente trabalho irá ser continuado ao longo das 
seguintes linhas: 

a) Alargamento da gama dos parâmetros testados, 
nomeadamente outros valores da humidade, da 
velocidade do vento e da carga de combustível; 

b) repetição dos ensaios com outros combustíveis; 

c) utilização de um novo sistema de aquisição dos 
valores da temperatura; 

d) automatização do processo de medição das 
características geométricas da chama, recorrendo a 
técnicas automáticas de análise de imagem 
aplicadas às gravações vídeo dos ensaios. 
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RESUMO 


O problema da inversão sísmica (obtenção de modelos 
para a crusta e o manto superior a partir de 
observações à superficie) é apresentado, e os 
fundamentos da teoria de Backus e Gilbert são 
discutidos, dando especial relevo aos conceitos de 
não-unicidade das soluções, resolução espacial e 
trade-off entre resolução e erro. São apresentados 
alguns detalhes sobre a inversão de máxima 
verosimilhança, a inversão estocástica e a inversão por 
decomposição espectral (análise de valores próprios). O 
método da inversão generalizada é estudado com 
algum pormenor. Finalmente, um conjunto de dados 
telessísmicos registados na Estremadura é invertido 
com o método estocástico [8]. 


1-Introdução 


O objectivo fundamental da sismologia experimental 
consiste em obter informação sobre a natureza geológica 
da crusta, a partir de dados obtidos à superfície ou (em 
menor escala) segundo perfis verticais. Regra geral, 
pretende-se conhecer a distribuição espacial da 
velocidade de propagação das ondas sísmicas, a 
localização das interfaces entre camadas de natureza 
geológica diversa e a atitude dessas interfaces. A 
estratificação que normalmente ocorre na crusta 
terrestre é o ponto de partida para um grande número de 
técnicas de prospecção, em que se admite que as várias 
camadas são homogéneas e separadas por interfaces 
planas, horizontais ou ligeiramente inclinadas. Os 
métodos mais antigos de prospecção sísmica assentam de 
facto na hipótese de que a crusta é estratificada, e 
exploram a informação contida em dois tipos de onda: as 
ondas que sofrem reflexão nas interfaces (ondas 
reflectidas) e as ondas que, atingindo as interfaces com o 
ângulo de incidência crítico, são refractadas ao longo da 
descontinuidade e regressam à superficie (ondas 
refractadas ou head-waves). À primeira técnica constitui 
o método da reflexão, usado pela primeira vez com fins 
comerciais em 1927, e a segunda constitui o método da 
refracção, o qual, apesar de ter sido suplantado em 
aplicação e popularidade pelo anterior, se desenvolveu 
mais cedo, em 1922. O nascimento da sismologia 
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ABSTRACT 

The inverse problem of seismology, which consists of 
modelling the crust and upper-mantle from surface 
data, is presented. The fundamentals of the theory of 
Backus and Gilbert are discussed, with emphasis on 
the concepts of non-uniqueness of solutions, space 
resolution and error-resolution trade-off. Some details 
are given on maximum-likelywood inversion, 
stochastic inversion and spectral-decomposition 
inversion. The generalized inversion is discussed with 
particular detail. Finally, a set of teleseismic 
traveltime data recorded in the Portuguese 
Estremadura is inverted with the stochastic method 
[8]. 


experimental parece estar ligado à necessidade de 
localizar com precisão as peças de artilharia pesada 
inimigas, durante a Primeira Guerra Mundial. 

Um método menos restrictivo quanto às configurações 
admissíveis para o modelo de velocidades é designado 
por tomografia sísmica. Numa das variantes deste 
método, um volume determinado do interior da Terra é 
dividido em blocos, no interior dos quais se admite que a 
velocidade é constante. Num conjunto de estações 
sismográficas dispostas sobre o volume em investigação, 
registam-se os tempos de chegada de um conjunto de 
sismos distantes (tele-sismos) , e comparam-se esses 
valores com os que são previstos por um modelo de 
velocidade inicial (geralmente, estabelecido a partir de 
estudos de reflexão ou refracção). Estabelecem-se 
relações lineares entre os resíduos dos tempos de 
chegada e as diferenças entre o modelo real e o modelo 
inicial, e esse sistema de equações é invertido, 
permitindo aperfeiçoar o modelo inicial e prosseguir 
Iterativamente. 

O número e as dimensões dos blocos em que o volume 
a analisar é discretizado depende da densidade da 
“malha” que os raios sísmicos definem no interior do 
volume, e essa densidade depende criticamente do 
espaçamento entre as estações e da distribuição 
azimutal dos epicentros. A discretização em blocos reduz 
drasticamente a sub-determinação inerente à inversão 
de dados sísmicos: se a velocidade fôr encarada como 
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uma função que varia continuamente no espaço de modo 
arbitrário, nunca poderá ser resolvida a partir de 
resultados de observações sismológicas, que constituem 
sempre um conjunto finito de dados. Mesmo após a 
discretização do modelo, na generalidade dos casos o 
problema inverso contém ainda um elevado grau de sub- 
determinação, e os diferentes métodos de inversão 
conduzem a uma solução particular que é óptima 
segundo os respectivos critérios. 

A não-unicidade das soluções não é específica da 
inversão sísmica, já que afecta quase todos os problemas 
de inversão geofísica, nos domínios da gravimetria, do 
geomagnetismo, da prospecção eléctrica, etc... Por esse 
motivo, a teoria da inversão de dados geofísicos tem-se 
desenvolvido recentemente numa formulação abstracta, 
sendo depois os resultados aplicáveis aos vários 
problemas particulares. O ponto de referência no que 
respeita a esta nova atitude em relação à inversão são os 
trabalho de BACKUS e GILBERT [1,2], em que se 
atribui a devida importância a questões como a 
não-unicidade das soluções, a resolução espacial de um 
conjunto de dados, o reflexo dos erros experimentais 
sobre as soluções e a sua relação com a resolução 
espacial. Com base nesta nova filosofia, a década de 
setenta conheceu um grande número de técnicas de 
optimização das soluções do problema inverso. 


2 - Teoria geral da inversão 


A designação de "problema inverso” justifica-se na 
medida em que, por definição, uma teoria é capaz de 
prever os resultados de uma experiência, uma vez 
estipulados certos parâmetros que regulem o sistema em 
que a experiência decorre. O problema que agora é 
discutido descreve essa trajectória em sentido contrário, 
partindo do conjunto dos resultados de uma experiência 
(geração, propagação e registo de uma ou várias ondas 
sísmicas) para chegar ao conhecimento dos parâmetros 
geofísicos que caracterizam a crusta. Para uma 
discussão mais detalhada da teoria da inversão, ver 
TARANTOLA [3]. 

A discussão da teoria geral da inversão pode ser feita 
numa base determinística, em que se pressupõe conhecer 
relações exactas entre os parâmetros que definem o 
modelo e as quantidades obtidas por observação 
(afectadas ou não de um erro experimental). Em geral, 
dispõe-se de uma certa informação a priori sobre os 
valores que podem tomar os parâmetros, e essa 
informação pode também assumir a forma de restrições 
definidas de um modo exacto. Alternativamente, todo o 
conhecimento de que se dispõe, quer sobre a relação 
entre dados e parâmetros (a teoria), quer ainda sobre os 
erros experimentais que afectam os primeiros, quer 
ainda sobre as restrições nos valores possíveis dos 
segundos, pode ser encarada de uma prespectiva 
probabilística, mais difusa mas mais geral. Passaremos 
a adoptar esta óptica para discutir os conceitos 
fundamentais envolvidos na teoria da inversão. 
Posteriormente, e com vista à discussão de aplicações 
práticas, será analisada a prespectiva determinística. 

Na acepção mais geral, o termo “parâmetro” aplica-se 
a qualquer variável física envolvida num dado problema 
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e que tome um certo valor, seja ele conhecido ou 
incógnito. Em muitos casos, no entanto, é possivel 
explicitar relações do tipo 

d, = 8, (PpPo e oPjpoPm) = 12, c.n (2.1) 
entre as quantidades d obtidas experimentalmente e as 
quantidades p que modelam o sistema. Em geral, 0 
termo "parâmetro" é reservado para estas últimas (valor 
certo, mas incógnito). Porque esta distinção não é 
intrínseca (é sempre possivel conceber a situação 
inversa em que os parâmetros são conhecidos, e as 
incógnitas são os “dados” d, situação designada por 
problema directo) é possível enquadrar o problema no 
espaço (n + m)-dimensional de todas as combinações 
possíveis de valores d e p, à que chamaremos Espaço 
Universal. 

Tendo em conta que um resultado experimental vem 
afectado de um erro, é mais geral tomar como dado não 
um valor numérico exacto, mas uma densidade de 
probabilidade definida sobre todos os valores que a 
variável em causa pode tomar. Em relação aos 
parâmetros, a informação apriorística, normalmente na 
forma de condições de positividade, desigualdades entre 
parâmetros ou limites superiores e/ou inferiores, pode 
também ser traduzida através de uma densidade de 
probabilidade definida no conjunto de todos os valores 
possíveis. Ambas as informações podem ser fundidas 
numa distribuição de probabilidade conjunta, que 
traduza a totalidade de informação disponível antes da 
inversão, através de uma densidade de probabilidade da 
forma p(d,p) definida no Espaço Universal. Sempre que 
não houver correlação entre as informações sobre os 
dados e sobre os parâmetros, é possivel escrever 


p(d,p) = p (dp (p) (2.2) 


A relação teórica (2.1) entre dados e parâmetros 
define no Espaço Universal uma hipersuperfície em 
geral não linear, que será designada por variedade 
teórica. Se se admitir que a teoria traduzida por (2.1) 
não é exacta, ou seja, que na sua dedução foram 
introduzidas hipóteses simplificativas, a variedade 
teórica passa a ter uma natureza mais difusa, e pode ser 
substituida por uma função de probabilidade 0(d,p) 
definida em todo o Espaço Universal e que traduza para 
cada ponto a probabilidade de que a variedade teórica 
passe por esse ponto. Se as simplificações da teoria forem 
justificáveis, é de esperar que O(d,p) seja máxima nos 
pontos que verificam (2.1). Se a teoria fôr exacta, será 


9 (d,p) = ôtd — g(p)) (2.3) 
onde d - g(p) = O é a versão vectorial da equação (2.1), e 
ô (.; é o delta de Dirac. 
O grau de abstracção a que foi levada a discussão do 
problema inverso permite obter de imediato uma solução 
geral, em contraste com a complexidade analítica que se 
enfrenta quando se aplica a teoria a um problema 
concreto. Define-se a função densidade de probabilidade 
a posteriorio (d,p) através da expressão 


o (d,p) = O (d,p) p (dp (p) (2.4) 


ou seja, a informação apriorística é pesada pela 
probabilidade teórica 9(d,p). É interessante notar que a 
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equação (2.4) contem implícita a resolução quer do 
problema directo quer do problema inverso, os quais, 
como já haviamos referido, não são intrinsecamente 
distintos, mas sim facetas diferentes do problema mais 
geral que consiste em ajustar informação prévia à luz de 
uma teoria. É esse problema que é resolvido em toda a 
sua generalidade pela expressão (2.4). 


3- A Teoria de Backus e Gilbert 


Já foi referido no parágrafo 1 que o resultado de uma 
campanha sísmica é sempre um conjunto finito de dados, 
referidos a uma rede de estações de observação e a um 
certo número de localizações do ponto de tiro, e que, a 
menos que se imponham condições restritivas, o modelo 
de velocidades é uma função com o contradomínio não 
discreto, na melhor das hipóteses dependendo apenas de 
duas ou de uma só coordenada espacial. Desta 
circunstância resulta que a não-unicidade de solução do 
problema inverso é tão geral que (enquanto se tratar de 
inversão sísmica) os casos que a ela fugirem podem ser 
considerados patológicos. Numa extensa classe de 
problemas de Geofísica, incluindo a inversão sísmica, é 
possível estabelecer entre os dados e os parâmetros uma 
equação integral linear da forma 


d, — | G. tr) m(r) dr (3.1) 
designada por Equação Integral de Fredholm, a qual 
vem substituir neste parágrafo a relação (2.1) do 
parágrafo anterior. Aqui, d, representa um conjunto 
finito de dados, supostamente livres de erros 
experimentais numa primeira análise, m(r) representa o 
modelo, que por simplicidade é considerado dependente 
de uma única variável espacial r, e G (r) é um núcleo de 
integração que traduz a teoria. Esta equação, 
estabelecendo um funcional linear“ entre o modelo e os 
dados, aponta já para um aspecto importante da teoria 
da inversão: a linearização. De facto, alguns problemas 
não lineares (i.e., nos quais não é possível definir 
relações do tipo acima) são reduzidos ao caso linear 
recorrendo ao método das perturbações, através de 
técnicas standard ou específicas. De qualquer modo 
serão discutidas oportunamente algumas técnicas de 
tratamento não linear”. 


2) Designa-se por funcional uma aplicação injectiva em que o 
domínio é um espaço de funções e o contradomínio é R. O 
qualificativo linear aplicado a um funcional em nada difere do 
seu significado usual. 


d) Mais exactamente, a hipótese importante na teoria da Inversão 
não é a linearidade, mas sim a diferenciabilidade à Frechet. Se 
os dados estão relacionados com o modelo através do funcional 
d = Fr (m(r)), diz-se que E é Frechet-diferenciável em mtr) se 
F tm +Bm)=d + bd com dd, =JD tmsr) mtr) dr + O (f (6m/“dr). 
D, tm;r) tomam o nome de derivadas parciais em ordem aos 
parâmetros. Prova-se que um funcional diferenciável à Frechel 
e linear pode ser sempre escrito na forma (3.1). 
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O problema da não unicidade da solução da Equação 
Integral de Fredholm reduz-se ao problema da existência 
de soluções da equação homogénea. Seja m uma solução 
não trivial da equação homogénea: então, qualquer 
função da forma m + cem, em quem é uma solução 
particular da equação completa e c é um escalar 
arbitrário, é ainda uma solução da equação completa, o 
que prova que estas soluções existem em número 
infinito. Por outras palavras, se o modelo real tem 
alguma componente no espaço aniquilador do operador 
integral / G (r) (.) dr, essa componente não pode ser 
reconstruida a partir dos dados. 

O grau de não unicidade do problema inverso pode ser 
reduzido seleccionando de entre todos os modelos 
compatíveis com os dados aqueles que são dotados de 
significado físico, em face da informação apriorística de 
que se dispõe, a qual já foi caracterizada anteriormente. 
A teoria de Backus e Gilbert dá resposta à seguinte 
questão: que fazer com a classe de todas as funções 
razoáveis, compatíveis com os dados, e geofisicamente 
significativas? E a filosofia em que assenta é a seguinte: 
são relevantes apenas as propriedades que forem comuns 
a todas as soluções da classe. De facto, se a teoria for 
exacta, essas propriedades pertencem também ao modelo 
real. 

Backus e Gilbert [1| investigaram as propriedades de 
funcionais com a forma 


<m> = | A(r ,r) m(r)dr (3.2) 
em que m(r) é o modelo real e o núcleo de amostragem 
A(r ,r) é unimodular, ou seja, / Ar ,r)dr =1. Para além 
disto, as médias <m> devem ser calculáveis 
exclhisivamente a partir dos dados, através de uma 


relação linear da forma 


2ad 


<m e = (3.3) 
| 
o que permite concluir de imediato a relação 
Atr sr) — » aG (r) (3.4) 


|] 

como se verifica combinando (3.3) com (3.1) e 
comparando com (3.2). Então, se as constantes a forem 
escolhidas de modo a que o núcleo de amostragem Atr ,r) 
se aproxime tanto quanto possível de um 6 de Dirac 
centrado emr ,a média <m> será uma boa estimativa 
do valor real mír, ), como mostra à equação (3.2). Uma 
vez que <m> é calculado directamente a partir dos 
dados, os resultados obtidos caracterizam toda a classe 
de soluções aceitáveis, e são por isso tão significativos 
como os próprios dados. Em geral, a estimativa <m>. 
do valor m(r ) é uma média pesada dos valores m(r) com 
r=r,€ tem uma resolução espacial limitada pela 
largura do pico do núcleo A(r ,r) em torno de r. Este 
conceito de resolução espacial é fundamental em toda a 
teoria de Backus e Gilbert. 

Os critérios de deltaness,ou seja, de aproximação 
entre a função Alr ,r) e S(r-r ), são variados e, se não 
apresentam grande dificuldade analítica, são 
normalmente fonte de morosidade no tratamento 
numérico. Um processo consiste em minimizar o 
estimador da largura do pico de A(r ,r) em torno de r, 
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dado por 


p= 12 | (at ote-r,P ar (3.5) 


fornecendo o valor minimizado uma medida da resolução 
espacial obtida. 

Por detrás deste método está a hipótese de que o 
modelo real varia com uma certa suavidade, caso 
contrário a estimativa <m = poderia estar 
arbitrariamente longe do valor m(r ) a estimar. 

Até este ponto temos admitido que os dados não estão 
contaminados por erros experimentais, o que é pouco 
realista. Backus e Gilbert [2] chegaram à conclusão 
importante de que deve haver um compromisso entre a 
resolução espacial da solução e a sua contaminação pelos 
erros experimentais, já que um aperfeiçoamento num 
dos sentidos implica sempre uma deterioração no outro 
sentido. Admitindo que os dados d estão afectados de um 
erro gaussiano de média nula e variância comum 02,a 
equação (3.3) permite concluir, dada a sua Enearidado 
que a estimativa <m> vem também afectada por um 
erro gaussiano de variância dada por 


2 2 pi 
02-05 
l 


desde que os erros sejam mutuamente não 
correlacionados. Tanto a resolução espacial, medida pelo 
estimador (3.5), como a variância o 2 dependem das 
constantes a, e se se considerar um espaço enquadrado 


(3.6) 


figura 1 - Diagrama de trade-off. 


por essas duas quantidades (figura 1) é possivel verificar 
que, entre todos os conjuntos a correspondentes à 
condição de que A(r ,r) seja unimodular, o critério de 
minimização simultânea de ambas as fontes de 
imprecisão conduz a uma curva do tipo indicada na 
figura 1. Esta curva toma o nome de diagrama de 
trade-off de resolução e erro. Esse diagrama deve ser 
explorado em função do compromisso mais conveniente: 
por exemplo, se se souber de antemão que o modelo real é 
muito lentamente variável no espaço, será conveniente 
diminuir a resolução espacial em favor do significado 
estatístico da solução; se pelo contrário é previsível a 
ocorrência de saltos bruscos nos valores dos parâmetros, 
é da precisão que se deve prescindir (afectando os 
resultados de maior desvio padrão) em favor da 
resolução espacial. 
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4- Algumas soluções particulares do 
problema inverso 


A teoria de Backus e Gilbert não conduz a uma 
solução do problema inverso, mas sim à maneira de 
inferir correctamente sobre as propriedades da solução 
exacta. Outros métodos são distintos, na medida em que 
apontam para a exploração da variedade teórica à luz de 
um determinado critério de optimização, conduzindo 
portanto a uma solução bem definida (que em geral não 
coincidirá com a solução exacta). Neste parágrafo vamos 
abordar alguns desses métodos. 

Uma via bastante importante que tem sido explorada 
consiste em tomar como informação apriorística a 
natureza estatística dos erros que afectam os dados e as 
estimativas dos modelos. Neste desenvolvimento vamos 
estudar o caso de modelos discretos, o que permite um 
cómodo tratamento matricial. Para um problema linear, 
a teoria será expressa por 


d=Gm d =(d dos. .sd) (4.1) 
i n 
= (m po e mo) 
sendo G uma matriz de coeficientes conhecidos. Se fór 


possível admitir que os erros nos dados têm uma 
distribuição gaussiana e que a sua matriz de covariância 
é C (nxn), a sua densidade de probabilidade conjunta 
será (agora não se impõe que os erros sejam não 
correlacionados): 


er? | (42) 


o Dei iii) ás 
fd) = o EXP = 10 Gm) C, (d -Gm) 


2m 

A solução que maximiza esta probabilidade deve 
minimizar a quantidade 
tac! (4.3) 

(d— Gm) C, (d-Gm) 
que pode ser interpretada como uma média pesada dos 
resíduos quadráticos, sendo os pesos os elementos da 
matriz de covariância. Se os erros forem não 
correlacionados e tiverem variância comum o 2, será C. 
= 021,ea minimização incide sobre a cnnntidade 
|d- Gm ou seja, cai-se na optimização de minimos 
quadrados tradicional. 

Se se pensar que um problema de inversão passa 
muitas vezes pela linearização de um problema não 
linear, utilizando o método das perturbações, é natural 
que se pretenda minimizar |m|2, pois isso é 
particularmente conveniente para o desenvolvimento 
iterativo em torno de um palpite inicial. No espírito do 
procedimento anterior, vamos considerar antes a 
minimização da quantidade 

no» (4.4) 
m 
o que pressupõe algum conhecimento sobre a covariância 
dos erros que afectam as estimativas dos parâmetros do 
modelo, através da matriz de covariância Cy. Este 
conhecimento é em geral de natureza conjectural, e 
introduz uma subjectividade inerente a este método que 
é o seu principal ponto fraco. 
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A técnica que consiste em minimizar conjuntamente 
as quantidades 
(d-Gm)Crtd-Gm) e m Cri'm ni 
toma o nome de inversão de máxima verosimilhança. 
Supostas conhecidas as matrizes Cj e Cm, € tendo em 
conta que são ambas definidas positivas, é possível 
escrevê-las na forma 

C=DLD! C =ML M gi 

d d m m 

em que as matrizes D e M são compostas pelos vectores 
próprios de Cj e Cm (que são ortogonais), Ly e Lm são 
matrizes compostas pelos valores próprios de Cy e Cm 
na diagonal principal e zeros fora dessa diagonal. O 
processo de minimização conduz [4] à solução 
A (4.7) 
myy=MLIGO LT *D'd 
em que Gg! é o operador de inversão generalizada que 
será definido no parágrafo seguinte. 

A inversão de máxima verosimilhança passa pelo 
cálculo do operador de inversão generalizada, o que 
exige o recurso a um processo de decomposição espectral 
da solução que nas aplicações com interesse se torna 
caro em termos de computação. Um procedimento 
diverso e que requere apenas multiplicações e inversões 
de matrizes foi desenvolvido sob a designação de 
inversão estocástica. Admite-se que os dados se podem 
decompôór em sinal e ruído, segundo 


d=Gm+n re) 


sendo m e n processos estocásticos, ou seja, famílias de 
variáveis aleatórias, de média nula e com matrizes de 
covariância Cmm € Cnn, respectivamente. Procura-se o 
operador matricial L , designado operador de inversão 
estocástica, que minimize o resíduo quadrático |m - Ld|2. 
O processo clássico de minimização conduz à 
expressão 
| E (4.9) 
L=C Cu 
sendo Caa a matriz de covariância dos dados e Cmg à 
matriz de covariância cruzada entre os dados e o modelo. 
Impondo a independência estatística entre m e n, 
conclui-se por linearidade que 


(4.10) 
Cu=00,.G'+€ 
mim nm 
(4.11) 
eco 
md mm 
e finalmente a solução pode ser escrita na forma 
(4.12) 


m =C Gglcila 
5 mm dd 
De passagem, registe-se um caso especialmente 
importante, que corresponde a admitir-se que as 
covariâncias são da forma Cmnm=0m* Im € Can=0n2 1h; 
neste caso o operador de inversão estocástica admite a 
seguinte expressão: = 
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L,=C ma (GC G+C) 
mm mm 


nn 


= (GTG +) (4.13) 


Este algoritmo toma o nome de operador de 
mínimos quadrados amortecidos, por motivos que 
serão discutidos mais adiante. 

Dada a imprecisão intrínseca dos dados 
experimentais, e em muitos casos a natureza 
aproximada das teorias, a solução do problema inverso 
tem geralmente as duas seguintes caracteristicas: a 
solução obtida não verifica os dados experimentais, 
quando a partir dela se resolve o problema directo; e os 
dados não contêm informação sobre determinadas 
componentes do modelo real. A análise de vectores 
próprios matriciais, ou desenvolvimento espectral, 
método aplicado à resolução de sistemas lineares pela 
primeira vez por LANCZOS [5], tem a vantagem de 
deixar perfeitamente claro, ao longo da resolução, quais 
as zonas do espaço de modelos que não são "iluminadas" 
por um conjunto de dados, e quais as zonas do espaço de 
dados cujos pontos não podem ser obtidos resolvendo o 
problema directo, qualquer que seja o modelo. 

Considere-se a equação 
(4.14) 


d,= | G. (r)m(r)dr = 1,2 ...h 


em que admitiremos que os dados estão contaminados de 

erros gaussianos e ainda que d; e G; foram normalizados 

pelo desvio-padrão o; dos dados, de modo a que estes 

tenham variância unitária. A matriz definida por 
(4.15) 

T,= | G, (1) G (r)dr 
é por construção definida positiva e simétrica, e pode ser 
diagonalizada na forma 


4.16 
M'T M=L PR) 


sendo a diagonal de L composta pelos valores próprios de 
T colocados por ordem decrescente: 


com À 249 2 92 ....214,20. 


Prova-se que as funções definidas por 

“ | (4.17) 
p (=a7" 5 M, G.(r) 

constituem um sistema ortonormado [6] e que é possivel 

decompór qualquer modelo na forma 


= > 


. (4.18) 
ay +y 
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sendo a;, a projecção de m(r) segundo w; (r), dada por 
= (4.19) 
a =Jwy,(r) m(r)dr=A. à 2.M,d, 

O resíduo wy* inclui qualquer componente de m(r) que 
seja solução da equação homogénea, imprevisível a 
partir dos dados, e ainda as componentes de m(r) 
associadas a valores próprios nulos. Um importante 
resultado é o seguinte: o desvio padrão de que vem 
afectado cada coeficiente a; é justamente A;1/2, o que 
permite considerar (4.18) como a decomposição de m(r) 
numa base em que a incerteza é crescente com o índice. 
Então podem ser convenientemente filtradas as 
componentes da solução associadas a valores próprios 
pequenos. Deste modo, a solução ficaria a um tempo 
mais suavizada e menos afectada pelos erros 
experimentais, o que é novamente o compromisso a que 
alude a teoria de Backus e Gilbert. 

O número de componentes a considerar no 
desenvolvimento introduz um factor subjectivo, mas 
pode ser determinado pelo seguinte critério: quanto mais 
extensa for a truncatura maior será a discrepância entre 
dados d; e os valores d;' obtidos por solução do problema 
directo a partir da solução do problema inverso. Então, a 
quantidade. 

(4.20) 
2 — 2 
x= > (d-d) 


pode ser tomada para controlar o ajustamento, 
Verifica-se que esta estatística tem uma distribuição de 
x2 com (n-p) graus de liberdade, pelo facto de os d; serem 
gaussianos, sendo p o número de parcelas tomadas no 
desenvolvimento. 

Os últimos métodos analisados têm como ponto de 
partida a existência de uma relação linear entre dados e 
parâmetros do modelo. Já foi visto que esta linearidade é 
muitas vezes uma aproximação, e a convergência de um 
tal esquema pode ficar comprometida sempre que a não 
linearidade do problema for severa. Veremos em seguida 
alguns métodos para lidar com a não-linearidade. 

Seja d = g(m) uma relação teórica não linear, e seja 
m, um palpite inicial. O procedimento mais directo seria 
aplicar o método dos minimos quadrados, minimizando o 
resíduo quadrático médio dado por 


(4.21) 
b=|d — g(m) 
Se se admitir que 
g(m)=g(m,)+ Gm. com m=m-m, 
(4.22) 
õg, 
e G (—) 
J om. 
E m=m, 
pode escrever-se que 
(4.23) 


' 12 
p=|d — Gm | 
A solução de mínimos quadrados pode ser escrita na 
forma standard 


com d=d -g(m,) 


: RA (4.24) 

m,=(G G) Gad 
e o processo iterativo procede definindo m, = m, + my, 
e introduzindo a nova relação linear 


g (m)=g(m )+Gm 


J = 
m=m, 


Na maioria das situações com interesse, o sistema 
(4.24) não pode ser resolvido. Mesmo para os casos em 
que GTG é não-singular, este esquema iterativo pode ser 
divergente, em face de uma não-linearidade forte. O 
método do gradiente é um processo alternativo de 
convergência garantida, mas que perde em rapidez de 
convergência, já que é um método extremamente lento. 
Aqui, a iteração é feita na direcção de máxima variação 
da quantidade 4. O plano tangente à superfície p = dy 
no ponto m = m, tem por equação 


e 
al 
e o vector que lhe é perpendicular (apontando no sentido 


decrescente de bp) tem por componentes as derivadas 
parciais 


(4.26) 


(m-m )J=0 
J 0] 


dp 


=m 
om, e Ú 


[— 


Este vector será designado por m'g. Tendo em conta a 
expressão de &, este vector tem componentes 


G. (4.27) 


m.=-25 G.d. 
i e dE 


dg, 
G, nad am. ) m=m 

J 
Dada a lenta convergência deste processo iterativo, foi 
sugerido que a iteração avançasse numa direcção 
intermédia entre as de m' e m'g. À equação (4.24) dá a 
expressão de m', e a equação (4.27) permite concluir 
que m'G tem a direcção de GTd. A solução intermédia 

pode ser expressa na forma 


u 


a e (4.28) 
m, =(G G+el) G d 

e tem a direcção de m',, quando É = 0, aproximando-se 
assimptoticamente da direcção de m'G quando £ cresce. 
Comparando (4.28) com (4.13), é interessante verificar 
que esta estimativa, designada por solução de 
mínimos quadrados amortecidos, não é mais do que a 
solução estocástica no caso especial então considerado. 
De notar também que (GTG +21) é sempre não-singular. 
A exploração do espaço de modelos para a obtenção de 
um palpite inicial numa zona de mínimos da função é 
pode ser feita através da geração de pontos do espaço de 
uma forma aleatória, investigação e selecção desses 
pontos em função do correspondente valor de p. Nisto 
consiste essencialmente o método de Monte Carlo”. 
Naturalmente, é um método extremamente lento, o que 
é um preço a pagar quando o problema é não linear. 
Quando o problema é linear, e se conhecem limites 
superiores e inferiores para os parâmetros do modelo, 
essas condições (elas próprias não lineares) definem no 


32 Técnica - 90 


espaço de modelos um poliedro convexo, e a exploração 
do espaço no sentido da minimização de & pode ser feita 
apenas sobre os vértices do poliedro, já que a teoria prevê 
que apenas sobre esses vértices possam ocorrer os 
valores extremos. À exploração é neste caso 
extremamente rápida e eficaz, e constitui um exemplo de 
aplicação de uma importante técnica de resolução de 
problemas lineares, designada por programação linear. 


5 - Inversão generalizada 


O método da inversão generalizada apresenta 
uma solução para o problema linear 


atá (5.1) 
em que G é uma matriz NxM de coeficientes conhecidos. 
A solução é obtida pelo método da expansão espectral já 
discutido. 

O Espaço Universal pode ser dividido em dois 
subespaços, da forma (d,0) e (0,m), com d=(dy,,...,dn) e 
m=(m,,...,mm), à& que chamaremos respectivamente o 
espaço de dados e o espaço de modelos (esta 
terminologia, por óbvia, já foi utilizada anteriormente 
em vários pontos). A matriz definida por 


T= 01G 


(5.2) 


0" 10 
é hermítica por construção, e por isso tem N+M valores 
próprios reais, soluções da equação 


det(T-AD=0. (5.3) 
O vector próprio associado a cada valor próprio A; 
verificará 


Tw=A. w, (5.4) 
e, se se considerar w; como a soma de dois vectores, um 
contido no espaço de dados e outro contido no espaço de 
modelos, de acordo com 


w =(u, 10)+(0 Iv) 
a forma especial da matriz T permite escrever 


G V=À.u (5.5) 
ta u=Av, 

Este importante resultado estabelece que uma teoria 
linear, aqui representada pela matriz G, estabelece a 
ligação entre pontos do espaço de dados e pontos do 
espaço de parâmetros (i.e., permite inverter os dados) 
apenas através dos valores próprios não nulos da matriz 
T. Para os valores próprios nulos será 


4) Outros métodos de inversão, normalmente HSSUCIADOS BOB 
nomes de CHERNOV e de KEILIS-BOROK, utilizam a 
exploração aleatória exaustiva do espaço de modelos como meio 
de realizar a própria inversão. Nisso são distintos da aplicação 
agora referida, que apenas conduz a um palpite inicial. 
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(5.6) 
Glu =0 
As equações (5.5) permitem escrever que 
T E. 
rm =, (5.7) 
GG'u, = Nº u, 
e, tendo em conta que as matrizes GTG e GGT são 


hermíticas, conclui-se que os vectores u; constituem uma 
base ortogonal completa para o espaço de parâmetros. Se 
esses vectores, uma vez calculados, forem normalizados, 
é possível escrever 


(5.8) 


Ed 


nm =0. MI, 
Lo) 1] 


Verifica-se facilmente que se À; é solução da equação 
aos valores próprios (5.3) associada ao vector próprio 
(u; | v;), então -A; também é solução, associada ao vector 
próprio (-u; | v;). Seja 2p o número de valores próprios 
th; diferentes de zero: existirão N+M-2p valores 
próprios nulos. As equações aos valores próprios (5.7) 
terão p soluções não nulas cada, o que permite decompôr 
a matriz U (NxN) cujas colunas são formadas pelos 
vectores próprios u; na forma 


U= (US U,) 


em que U, incorpora os vectores próprios associados a 
valores próprios não nulos. De modo semelhante se pode 
construir a matriz V (MxM) cujas colunas são os vectores 
próprios v;, e decompó-la na forma 


V=(VIVo 


Nesta nova linguagem matricial, as equações (5.5) 
são 


(5.9) 


(5.10) 


GV =UL | 
p PP (5.11) 
GU =VL 
PPP 
sendo L, uma matriz diagonal formada pelos valores 
próprios A; não nulos. Esta matriz fora já referida no 
parágrafo anterior, quando pela primeira vez se abordou 
a temática do desenvolvimento espectral (por espectro do 
problema entende-se o conjunto dos valores próprios À;, e 
daí a designação). Para as matrizes U, e V, valerá 
GV =0 
0 (5.12) 
G'U,=0 
As quatro últimas equações matriciais podem ser 
condensadas na forma 


o = | (5.13) 
GV=G(V IV)=(U |Up(L 0) 


ou ainda 


5.14 
G=(U |[U)(L |0)(V [0)'=U 1 vt ) 
per -p p PP P 


Esta factorização põe em evidência que a teoria 
traduzida pela matriz G nada nos pode esclarecer 
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acerca das componentes dos parâmetros que pertençam 
ao espaço Vo, nem pode prever componentes dos dados 
que pertençam ao espaço U,. Por espaço V, entenda-se o 
espaço gerado pelas combinações lineares das colunas de 
Vo etc... 
Qualquer vector de V, adicionado a uma dada solução 
não afecta os dados (obtidos por resolução do problema 
directo), e esta é a essência da não-unicidade do 
problema inverso. 
Quando a matriz ULVT possui uma inversa (problema 
determinado) ela pode ser escrita na forma G-1= 
VLAUT, já que UUT = UTU = Iyx e VVT=VTV=aIy, 
como se conclui das relações (5.8). Por analogia, a 
inversa generalizada de G é definida por 
Gr =y Erg aa 
£ PP P 
A solução inversa generalizada é definida em 
conformidade por 
m,=G/ d. dh 
É importante notar que num problema determinado (i.e., 
tantas equações independentes como incógnitas) a 
matriz G é não-singular, e por isso não tem valores 
próprios nulos. Nesse caso a matriz admite uma inversa 
exacta, que coincide com a inversa generalizada, pois as 
matrizes Up e Vp são “completas”. Que a inversa 
generalizada degenere na inversa exacta quando o 
problema é determinado é um resultado que seria de 
esperar, pois em caso contrário dificilmente se poderia 
atribuir qualquer significado âquela solução. 
Quando todos os valores próprios nulos estão associados 
a vectores próprios do espaço de dados (i.e., existe espaço 
U, mas não existe espaço V,) a solução generalizada 
verifica 


= 
m,=(G' G) Glad 
ou 


Se m =G d 10) 
o que mostra que nas presentes condições a inversa 
generalizada degenera na solução de mínimos 
quadrados standard, pelo que se pode concluir que ela 
minimiza a norma |d - G my. 

Quando, pelo contrário, o espaço U, é nulo mas existe V, 
(problema com solução não-única mas em que os dados 
podem ser calculados de modo exacto a partir de 
qualquer das várias soluções) a solução generalizada 
verifica os dados, como veremos em seguida: 


Gm =gara=uL vívitura SB 
E E PP PPPÕÃÇP 
Ora a igualdade V5TV, = Ip verifica-se sempre (bem 
como UpTU, = Ip), dada a ortonormalidade dos vectores 
próprios v;. Porém, a igualdade VpVp! = Ip (ou U,UpT = 
lp) só se verifica para matrizes quadradas. No presente 
caso,a matriz Up é NxN, e por isso verifica-se UpTU, = 
In, o mesmo não se podendo afirmar do produto U,U,T. 
Nestas condições, a equação (5.18) permite concluir que 


Se a solução generalizada verifica os dados, qualquer 
outra solução que os verifique deve diferir de mp apenas 
nas componentes que possuir no espaço V,. Então será 


(5.20) 


m=m + Sar 
E o = 1 1 


imi?= Im JÉ+ > a (dado que v.. v=5,) qua 

Esta equação permite concluir que, quando não existe 
espaço U,, a inversão generalizada dá a solução com 
menor norma de entre todas as que verifiquem os dados. 

No caso geral, em que existem ambos U, e Vs, a 
inversão generalizada fornece uma solução qué 
minimiza simultaneamente |d - Gm| e |m!. 

O formalismo matricial da inversão generalizada 
permite analisar comodamente a resolução e o erro da 
solução. De facto, tendo em conta que 


=A essas (5.22) 
m =G d=(G G)m 
E g E 
conclui-se que a solução mp; = mytlr;) é uma média 
pesada dos valores mg(r;) em torno de r;, sendo os pesos 
os elementos da matriz G,-!G, que toma o papel do 
núcleo de amostragem da teoria de Backus e Gilbert. 
Esta matriz indica a resolução espacial da solução, a 
qual será óptima quando G;1G=1. Tendo em conta a 
equação (5.15), será 
Grlg=v LUIUÍL vi=v v' ae 
g PP PPP PP 
Novamente se conclui que a resolução é ideal quando 
não há valores próprios nulos associados ao espaço de 
modelos. Nessas condições será V,Vp! = Im, e a solução 
é única, ainda que os dados sejam imperfeitos. 
Por outro lado, se for Ad o erro que afecta os dados 
experimentais, o erro resultante na solução inversa 
generalizada será (dada a linearidade do problema) 


=” (5.24) 
Am =G Ad 
g g 


A matriz de covariância dos erros Am, será 


Nai Ed =.* 
Cam= [E (Am, Am) =G, Caal6, ) 


sendo Cag a matriz de covariância dos erros nos dados. 
Admitindo que estes últimos são gaussianos, 
estatisticamente independentes, e que têm a mesma 
variância 02, será 


dela = 19 elfo pet q 
Com=0"G7'(G7) =o?v LO!UTU Lo! (5.25) 


=0"V. LV 

PP p 
o que vem confirmar a asserção anterior segundo a qual 
os valores próprios muito pequenos contribuem para 
aumentar a variância da solução, já que os elementos da 
matriz representada por Lp 2 são A;2. O número p deve 
ser escolhido de modo a que, ignorando os valores 
próprios próximos de zero, se diminua a variância do 
erro da solução, sem que isso afecte damasiado a 


aa =d (5.19) resolução espacial. Esta questão de trade-off fora já 
o discutida aquando do estudo da teoria de Backus e 
como pretendiamos verificar. Gilbert. 
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6 - Modelação tomográfica da litosfera da 
Estremadura 


Apresenta-se em seguida a aplicação à Estremadura 
de um método desenvolvido por Aki et al.[7]. Para 
proceder à inversão, a crusta e o manto superior são 
divididos em camadas horizontais, as quais por sua vez 
se subdividem em blocos homogéneos, cada um dos quais 
caracterizado por um valor v; da velocidade de 
propagação. A solução é linearizada em torno de um 
modelo inicial, em que a velocidade é constante dentro 
de cada camada. 

Considere-se um raio que atravessa a camada i, 
percorrendo no seu interior o espaço d;, com a velocidade 
v;. Seja v; velocidade média da camada e d; o espaço que o 
raio percorria na camada com o modelo inicial de 
velocidades. Definindo a perturbação fraccional do 
inverso da velocidade, m;, através da expressão 
(6.1) 


1 1 
— = (| +m.) 
£ V; A 
o tempo de percurso real dentro da camada i será 
= 4 
d, d. + Ad, ii 
t. = +=(+" amp 
l v; v; l 
com Ad; == d; - d;. 


Se for NL o número de camadas do modelo, o tempo de 
chegada de um raio que atravessa todas as camadas será 


NL NL 4 
l 
t= Dtti+e= j =(U+m+ite= 


| i i 


NL d. NL , Ad. 16.3) 
= 3 — (1 + m.) + > (=a +m.)+tT+e 
|] : l 
“A i i V: 
sendo 1 o tempo de chegada à base do modelo e £ uma 
parcela que dá conta dos erros experimentais. Com o 
modelo inicial o tempo de chegada à base do modelo 
(calculado a partir dos dados) seria Li = 1- Area 
expressão (6.3) pode ser escrita na forma 


= um (6.4) 
= + 2 =(1+m)+e 
i V. 
com 
NL Ad. 
e'=e+Av+ E +m) 
i , 


É legítimo associar o erro experimental com as duas 
últimas parcelas de (6.3) porque, de acordo com o 
princípio de Fermat, o tempo de percurso é estacionário 
em relação a perturbações do percurso em torno do raio 
real, e essas parcelas são de ordem superior no 
desenvolvimento (6.4). 

Ao atravessar a camada i através do bloco j , um raio 
pode sofrer ligeiras contribuições de blocos vizinhos. Por 
esse motivo, a perturbação mi; corresponde ao bloco j da 
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camada i pode ser decomposta na forma 

— (6.6) 
m, = m i + âm, 

em que mi; é a perturbação média na camada Ji 

calculada a partir dos raios que atravessam essa camada 

quase exclusivamente pelo bloco j, e Ami; é um termo 

residual. A perturbação m; que afecta o raio no interior 

da camada i poderá ser escrita na forma 


NB (6.7) 


m.= 2, m,F, + Am, 


| 
onde F;; é um indicador que toma o valor 1 seo raio 
atravessa a camada i quase exclusivamente através do 
bloco j, e é nulo em caso contrário. NB é o número de 
blocos por cada camada. 
Seja t o tempo que um dado raio leva a atravessar o 
modelo inicial, ou seja, | = E d;/ v;. O desenvolvimento 
(6.4) pode ser reescrito, tendo em conta (6.7), na forma 


L-t=1+2 2 E; m, +e 
| (6.8) 


tendo a parcela e" absorvido os resíduos Am,. 

Se a rede de observações dispõe de um total de N 
estações, e designando por M=NBxNL o número de 
blocos de todo o modelo, as N equações correspondentes a 
(6.8) podem ser condensadas na forma 


(6.9) 


t-t=1+Gm+e — com G=tg,) 


Nx M 

As quantidades t, te e”, de acordo com o 
procedimento normal de linearização, são calculadas a 
partir do modelo inicial, e ainda a partir dos parâmetros 
focais do sismo e do modelo exterior. O sistema (6.9) é 
naturalmente alargado de modo a englobar os resultados 
da observação de vários sismos. 

À equação vectorial (6.9) presta-se à aplicação das 
técnicas de inversão atrás discutidas, como se evidencia 
escrevendo-a na forma 

. . - =- (6.10) 
t =Gm+e com t=t-(t+1) 

Dois erros que podem afectar esta equação são i) erros 
no modelo exterior, que afectam a parcela i e ii) erros no 
modelo inicial, que afectam os elementos da matriz G. 
Os primeiros podem ser suavizados se os epicentros 
utilizados tiverem uma boa cobertura azimutal, bem 
como em distância, em relação à zona em estudo. De 
qualquer modo, a sua contribuição para (6.10) é da 
mesma ordem que a dos erros na localização epicentral, e 
deve ser encarada com cuidado. Os segundos erros 
apresentam uma contribuição de ordem superior, e 
podem ser absorvidos por e. 

Esta metodologia foi aplicada a um conjunto de dados 
sísmicos registados na região da Estremadura entre 
Julho de 1987 e Junho de 1988. Os dados foram obtidos 
através da operação da Rede de Estações Sísmicas 
Temporárias da Estremadura (RESTE), um projecto que 
envolveu a participação do INMG e do Departamento de 
Ciências Geológicas da Universidade de Durham (Reino 
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Figura 2 - Distribuição dos epicentros dos tele-sismos usados para o 
estudo tomográfico da litosfera da Estremadura. Os epicentros estão 
assinalados por triângulos; a localização da rede de estações está 
indicada por uma estrela. Projecção equidistante. 

Unido). O projecto tinha por finalidade o registo de 
micro-sismos locais, mas foi igualmente registado um 
conjunto de sismos distantes, adequado ao estudo 

tomográfico da litosfera sob a rede de observação. 

A figura 2 mostra a distribuição geográfica dos 
epicentros dos 20 sismos utilizados, e a figura 3 mostra o 
conjunto de estações sismográficas envolvidas e um 
exemplo de registo sísmico digital. Os dados consistiram 
em 140 tempos de chegada, lidos com um erro inferior a 
+ 0.04s. 

O sistema de equações (6.10) foi construido segundo os 
passos já descritos, e adoptou-se para a inversão o 


BMJ m m BPT 
BOT 


mABV 


EAMG 


9W 


Figura 3 - Estações sismográficas usadas neste estudo, e exemplo de registo digital de um tele-sismo. Na figura da direita, as divisões 


algoritmo de inversão estocástica (4.13). Após vários 
ensaios, em que a resolução e a variância da solução 
obtida eram inspecionadas, adoptou-se como modelo de 
blocos o representado na figura 4. Os números aí 
mostrados indicam quantos raios atravessam cada bloco, 
e um circulo em torno do número indica que o bloco 
correspondente foi efectivamente modelado. O número 
de blocos modelados foi 59, tendo-se tomado como 
minimo aceitável para a resolução de cada bloco o valor 
0.70 (para o elemento correspondente da diagonal da 
matriz de resolução). Para o factor de amortecimento do 
método estocástico (coeficiente e na equação 4.13) 
adoptou-se o valor 0.10, após análise do gráfico 
apresentado na figura 4 (trade-off de resolução e erro). 

A figura 5 ilustra a solução obtida para as anomalias 
de velocidade na litosfera da Estremadura. A figura 6A 
mostra com mais detalhe a solução correspondente à 
camada mais superficial (0 a 30 km), aproximadamente 
coincidente com a crusta. Os valores numéricos 
correspondem ao desvio percentual da velocidade dos 
blocos em relação à média da camada correspondente. A 
distribuição dos pontos reflecte o facto de que as 
fronteiras entre os blocos foram orientadas em três 
direcções diferentes, sendo as várias soluções fundidas. 
Os desvios-padrão das anomalias obtidas não 
ultrapassam 0.75%, pelo que são tomadas como 
significativas as flutuações superiores a 2.5%. Na 
figura, as anomalias positivas são assinaladas por H, e 
as anomalias negativas assinaladas por L. A figura 6B 
apresenta o resultado da integração vertical das 
anomalias para toda a espessura da litosfera (0 a 
150km). A discussão do significado geológico das 
anomalias observadas pode ser encontrado em [8]. 


NOTA: Este artigo tem por base uma monografia 
realizada pelo autor em 1983 no âmbito da cadeira de 


verticais correspondem a 1 segundo. 
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rigura 4 - Modelo de blocos usado para a litosfera da Estremadura vertical exageration: 1.5 
JRntdeta a qui é ainda dá da maias vipulças + onabunta no Figura 5 - Representação gráfica da solução adoptada para as 
sera lap py sn ainsi tado pose ço a anomalias de velocidade sismica na litosfera da Estremadura. 
padrão médio e da pe resolução em função do parâmetro c do  ,ycam-se por as regiões de anomalia negativa em relação à média 
algoritmo de inversão estocastica. Este diagrama é um exemplo da camada, e por H as regiões de anomalia positiva. A separação 
de trade-off entre resolução e erro. T é o traço da matriz de entre isolinhas é de 2.5%. A discussão do possivel significado 
resolução, T, é o traço da matriz identidade da mesma ordem. geológico das anomalias pode ser encontrada em[8]. 


Prospecção Geofísica da Faculdade de Ciências de 
Lisboa. A aplicação descrita na Secção 6 foi levada a 
cabo pelo autor no Departamento de Ciências Geológicas 
da Universidade de Durham (Reino Unido), como 
bolseiro da Fundação Gulbenkian. 
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Figura 6 - A) Pormenor da solução adoptada para a primeira camada 
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do modelo, correspondente à crosta. Os valores numéricos 


representam desvios em relação à velocidade sismica média da 


camada, em percentagem. B) Média vertical das anomalias de 
velocidade, em percentagem, de 0 a 150 km de profundidade. 
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SUMÁRIO 


Referem-se, muito resumidamente, as aplicações 
dos ISFETs em medicina. 


The emergence of a new type of solid electrodes, 
utilizing the electrochemical properties of ion- 
selective membranes and the field effect of 
semiconductor devices based on metal-insulator- 
semiconductor (MIS) transistors [1,2], constitutes an 
important advance in all branches of science and 
technology where the problem of expeditious and 
selective determination of small amounts of 
substances in presence of others arises. An electrode 
of this type is designated ISFET (ion-selective field 
effect transistor) if it is used for determination of ions 
in solution. The first ISFET was described by 


ABSTRACT 


This short paper summarizes the great significance 
of ISFETs in medicine. 


Bergveld [3], in 1970, and since then many papers 
have appeared on this matter. 

Electrolyte concentration and vital gas partial 
pressures in blood are widely utilized, both as 
indicators of well being and as significant diagnostic 
information. Instantaneous measurement of Lhese 
parameters would be of great benefit not only to an 
anesthesiologist during surgery but also to a critical 
care nurse in providing optimum patient care. 

Specific ions such as Na”, K*, CI and Ca?' are 
often of interest, as is pH, pO,, and pCO, in 
monitoring the basic metabolic status of a patient. 
The characteristics of an ISFET make it a very 


Table | - lon-Selective Field Effect Transistors in Medicine 


SO, SIO» 


pres pm for electrophysiological purposes have been 


given [3,11]. 


Alumino- 
silicate 


Si3Na on S10> 
surface 


Production of a micromultisensor having two functions 
(Na* and pH) simultaneously [7, 12, 13]. 


Used for determining the tissue pH value of fish kidney. 


SiaNa on SO» 
surface 


SiaNa is most convenient for H' determination than SiO» 
[7,8,14-17]. 


Flow injection analysis and ISFETs are combined [15]. 
Sensors in catheter form have proved effective in serum 
| and blood [16,17]. 


Valinomycin in | SisNg and SiO; 
PVC with 
plasticizer 


AgCI- Ag2S 


| À spear-shaped sensor is described for intracellular and 
extracellular measurements [12]. 
K* is measured in horse serum [18]. 


| Cl" is measured in sweat [9]. 


| Micromultisensors having other functions (e. g., Ag") 
| have been described [17]. 


Standard MIS 
transistor 


lon-exchange 
|Ca** saltin PVC 
SiaNa SisNy on SiO;> 
surface 


| A stable and sensitive construction for biomedical 
purposes is described [19]. 


| Micromultisensors having several functions (Ca2*, pH, K') 
have been developed [4-6, 15]. | 
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attractive device for continuous in-vivo monitoring 
of these blood species, and indeed it has proved to be 
successful for such monitoring in animal studies 
[4-9]. 

The operation of ISFET sensors is similar to that 
of MIS transistors [10]. The only difference is that 
the function of the gate is performed by a sensing 
layer analogous to the the sensing element of ISEs. 
The sensing layer may be the oxide coating of the 
gate itself, but it is usually a coating made of a 
material constituing the sensing element of ISEs 
integrated with an insulating layer in contact with 
the gate oxide. Like the conventional potentiometric 
sensors, the ISFET is also placed into the solution to 
be tested together with a reference electrode. The 
potential arising between the sensing layer and the 
solution is in series with the gate of the device and as 
it tracks the sensing species it changes the threshold 
of the device. The drain current of the device is then 
a measurement of the ion-activity (or concentration) 
in solution. 

The technology used to produce the basic ISFET 
device is similar to that utilized in commercial VLSI 
circuits [10], so that new or exotic fabrication 
techniques are not necessary in order to realize the 
structure. ISFET production is currently under way 
in a number of institutions [20, 21, 23]. 

Most of the ISFET devices known at present with 
applicability in medicine are listed in Table I. The 
main merits of these devices are their small size, the 
use of all-solid materials, the possibility of 
construction of multisensors, the very short response 
time to changes of concentration, the low output 
resistance and the absence in most constructions of 
contact conductors between the membrane and the 
transistor. 

Despite their advantages, the ISFETs have 
drawbacks (the reference electrode, short lifetime, 
high temperature-dependence, encapsulation 
reliability, stability and linearity) which are of 
concern on optimizing them for the long term 
implantable applications. To minimize these 
difficulties, new dielectric multi-layers of SiO,, 
SisNa, SiC, Al2Os, AlzSs, Zr02 and insulating 
polymers, and the proposal of new ISFET 
configurations are being introduced [20, 22, 24, 25]. 

The author of the present communication worked 
recently with Prof. Janata at the University of Utah, 
where an excellent research group fabricates and 
characterizes new solid state microelectrochersical 
sensors, using up-to-date technologies and advanced 
physical methods. Preliminary work on the 
preparation and testing of the new gate dielectric 
materials (e.g., SiC and Diamond-like carbon), as 
well as investigation on a structure including an on 
chip reference electrode, showed that several current 
problems of the ISFETs can be eliminated, namely 
the cross-talk observed in multisensor arrays. 

The foregoing summarized communication 
shows that ISFETs are oí great significance in 


medicine, so that it will be worthwhile to intensify 
the research and development in this field. 


References 


[1] Janata, J., Huber, R.J., (1979), Ion-Selective 
Electrode Rev., 1,31. 

[2] Janata, J., Huber, R.J., (1980), Jon-Selective 
Electrodes in Analytical Chemistry, Freiser, H,, 
ed., Plenum Press, New York, 2. 

[3] Bergveld, P., (1970), IEEE Trans. Biomed. Eng., 
17, 70. 

[4] MckKinley, B.A., Saffle, J., Jordan, W.S., Janata, 
J., Moss, S.D., Westenshow, D.R., (1980), Med. 
Instrum., 14, 93. 

[5] MckKinley, B.A., Wong, K.C., Janata, J., Jordan, 
S.W., Westenshow, D.R., (1981), Crit. Care 
Med.,9, 333. 

[6] MckKinley, B.A., Houtchens, B.A,, Janata, J., 
(1981), Crit. Care Med., 9, 845. 

[7] Esashi, M., Matsou, T., (1978), IEEE Trans. 
Biomed. Eng., 25, 184. 

[8] Janata, J., Moss, SL.D., (1976), Biomed. Eng,., 


11, 241. 
[9] Janata, J., Moss, St.D., (1979), Anal. Chim. 
Acta, 108, 161. 


[10] Janata, J., (1985), Solid State Chemical 
Sensors, Janata, J., Huber, R.J., eds., Academic 
Press, Inc., New York, pg.65. 

[11] Bergveld, P., de Rooij, N.F., (1978), Theory, 
Design, and Biomedical Application of Solid 
State Chemical Sensors, Cheung, P.W., 
Fleming, D.G., Ko, W.H., Neuman, M.R., eds,, 
CRC, Cleveland. 

[12] Esashi, M., Matsuo, T., (1975), J. Japan Soc. 
Appl. Phys., 44, 339. 

[13] Matsuo, T., Esashi, M., (1978), Extended 
Abstracts of Electrochemical Society Spring 
Meeting, Abstr. 83, pg. 202, Seattle. 

[14] Bos, M., Bergveld, P., Van Veen-Blaauw, 
AM W., (1979), Anal. Chim. Acta, 109, 145. 

[15] Ramsing, A.V., Janata, J., Ruzicka, J., Levy, 
M.,(1980), Anal. Chim. Acta, 118, 45. 

[16] Comte, P., Janata, J., (1977), Proceedings of the 
30th Annual Conference on Engineering in 
Medicine and Biology, Abstr. 41.3, 19, pg. 297, 
Los Angeles. 

[17] Vlasov, Yu. G., (1979), J. Appl. Chem (USSR), 
s2,1. 

[18] Moss, S.D., Janata, J., Johnson, C.C., (1975), 
Anal. Chem., 47, 2238. 

[19] Yee, S.S., Afromowitz, M.A., Galen, P., 
Anderson, T., (1978),Extended Abstracts of 
Electrochemical Society Spring Meeting, Abstr. 
109, pg. 257, Seattle. 

[20] Harame, D.L., Shott, J.D., Bousse, L., Meindl, 
J.D., (1984), Proceedings of the 6th Annual 
Conference IEEE, pg. 444. 

[21] Bousse, L., de Rooij, N.F., Bergveld, P., (1983), 
IEEE Trans. on Electron Devices, ED-30, 1263. 


40 Técnica - 90 


C. A.C. Sequeira 


[22] Van der Shoot, B.H., Bergveld, P., Bos, M,, 
Bousse, L.J., (1983), Sensors and Actuators, 4, 
267. 

[23] Nakajima, H., Esashi, M., Matsuo, T., (1982), J. 
Electrochem. Soc., 129, 141. 

[24] Bousse, L., Bergveld, P., (1984), Sensors and 
Actuators, 6, 65. 

[25] Caras, S.D., Janata, J., (1985), Anal. Chem., 57, 
1924. 


Técnica - 90 41 


The ISFET in Medicine 


42 


Técnica - 90 


Rodrigo de Abreu 


The First Principle of Thermodynamics and the Non- 
Separability of the Quantities "Work" and "Heat" 


Rodrigo de Abreu 


Centro de Electrodinâmica, Instituto Superior Técnico 


Lisboa, Portugal 


RESUMO 


Analisa-se um modelo constituido por dois 
subsistemas que interactuam através de um 
êmbolo, verificando-se que é impossível separar a 
transmissão de energia em trabalho e calor. 
Embora o processo seja "quasi-estático” não é 
reversível. O Primeiro Princípio dU=dW+dQ, 
introduzido por Clausius, não permite com 
generalidade uma identificação com significado 
físico de dW e dQ embora dU=-pdV+TdS se 
verifique numa trajectória constituida por pontos 
de equilíbrio de cada subsistema. 


1- Introduction 


The concepts of work and heat appear associated in 
the First Principle of Thermodynamics, dU= dW+dQ. 
Although concepts such as work and heat historically 
originated prior to Clausius's work [1,2], the formalism 
emerging from the First Principle culminates with the 
introduction of the entropy through the expression 
dS=dQ/T. The success of Clausius's analysis explains 
the subsequent reinterpretation of the quantities work 
and heat involved [3] in the First Principle. This 
reinterpretation imposed itself by its formal success, the 
acceptance of which is almost universal today. The 
contradictions [4,5] of these reinterpretations have been 
analysed elsewhere [6]. In this paper one simple but 
fundamental aspect is analysed. 


2- The First Principle of 
Thermodynamics, the e ds 
conservation principle and the 


concepts of work and heat 


Consider the situation represented in Fig.l 

Assume that on the sides 1 and 2 of the piston there 
are atoms of the same monoatomic ideal gas. The piston 
is made of a material for which the thermal conductivity 
is zero and the piston is initially blocked so that it 
cannot move. Thus, initially no energy can pass from 
side 1 to side 2. We take the initial temperatures, T and 
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ABSTRACT 


The impossibility of separating into work and heat 
the energy transmitted between two subsystems 
through a movable piston is analysed in this 
article. The process here described, although 
"quasi-static", is not reversible. It is shown that the 
First Principle, dU=dW+dQ, introduced by 
Clausius, does not generally allow a physical 
identification ofdW and dQ, although 
dU=-pdV+TdS is verified along the equilibrium 
points of each subsystem. 


PISTON 


fig. 1 - An adiabatic piston surrounded by a gas. The inicial values 
areP =P andT, <Ta. 


T,, to be different, and the initial pressures, P and P, to 
be equal. Once unblocked, the piston gains a 
translational energy to the right of order 1/2KT, from a 
collision with a side | molecule, and a translational 
energy to the left of order 1/2KT from a collision with a 
side 2 molecule [7,8]. In this way energy passes mainly 
from side 2toside IT, >T.. 

Generally if the thermal conductivity is not zero 
energy can pass through the piston. But in the ideal case 
we are considering, the energy can only pass if the piston 
is moving. Since in the case the piston is “adiabatic”" 
("dQ"=0 for the piston) and the process is "quasi-static" 
(there is equilibrium at all times on sides 1 and 2 and the 
pressure and temperature are well-defined on each side), 
one might anticipate that the process is also reversible 
and thus isentropic (adiabatic and reversible). In fact 
this is not true, as can be confirmed by solving the 
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isentropic equations, 
y Re 4 'y 
P, Vi =Pv, (1) 
and 
Y-p vY 
Fava =Po vo (2) 


Here unprimed quantities refer to the initial state, 
primed quantities to the final state, and y=C,/C,, where 
C,and C, are the specific heats at constant pressure and 
volume, respectively. The solution of the isentropic 
equations is given in the appendix. 

The correct solution for the process as it actually 
occurs is obtained by imposing energy conservation 


U=U,+U,=U,+U,, (3) 


equality of the inicial and final pressures on the two 
sides 


P=P,, P-=P, (4) 
equality of the final temperatures on the two sides 
T =" md (5) 
and 
à di Pig A Ê (6) 


The final pressure on the two sides are given by 


n 
P=ORT 07) 
V, 
and 
Ê 
P=RT (8) 
“ [|] 
Vo 


where n, and n, are the numbers of moles of the gas in 
the volumes V and V, respectively. 
From Eqs. (4), (5), (6), (7), and (8) it follows that 


A. 
V=-2 y (9) 
é n,+n, 
and 
n 
l 
= y (10) 
n;+n, 


Since the actual physical process is "quasi-static" 
(although not reversible), it follows that 


dU=-PdV +TAS, (11) 


and 


But, Eq.(3) implies that 
dU +dU,=dU=0. (13) 
Therefore, from Eqgs. (11)-(13) it follows that 
(14) 


Pav Ts, = PV Ts, | 


Since the pressures on the the two sides of the piston 
are equal at all times and the total volume is fixed 


Eu (15) 
E" 
and 
dV =-dV, 1) 
It follows that for the actual physical process 
E (17) 
Tds, = —TodS, | 
Of course, for an actual physical process, 
dS=dS +dS,>0. (18) 
Equations (17) and (18) immediately lead to 
7 | 
as (1--*)>0. (19) 
l E, 
IT,>T,itfollows that 
dS,>0. 120) 
From Egs. (17) and (20) it follows that 
dS,<0 | (21) 
Moreover, if Ly then dV,<o, dU,<oO, and 


TdS,<o0. 

In this process just considered, the pressures on the 
two sides of the piston are equal at all times, which 
means no “work” is done. However, the energy transfer 
occurs through the agency of the moving piston, and if 
one considers “work” to be energy transfered via 
macroscopic, non-random motion, then it appears that 
work is done. There is no paradox or problem here, since 
it is the net “work”, tle "work" done on side 1 by side 2 
+ the "work" done on side 2 by side 1, that is zero. 
Furthermore, since the thermal conductivity of the 
piston is zero, no "heat" flow is possible. However, the 
flow of energy is from the high temperature side to the 
low temperature side, and if one considers heat to be 
energy transfer resulting from a temperature difference, 
then it appears that there is heat flow. Obviously, there 
is a problem as far as what we mean by heat and work. 
We have here clearly, a difficulty of interpretation 
because we use the designations heat and work without 
a well defined meaning. Today the dominant ortodox 
point of view is that heat is what complements work in 
the expression AU = W+ Q, assuming that work is a well 
known entity with generality. This is not so because 
work is associated with the concept of force which has 
conceptual difficulties for variable mass systems [5,6]. 
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Everything including the problem presented here has a 
very simple interpretation if we abandon Clausius's 
point of view that heat is a special kind of energy 
transfer (caloric conception) and only use the more 
abstract concept of energy. In fact if we consider heat as 
internal energy we can say that heat is transformed 
into work when a gas expands and the mass associated 
with the piston has an increased gravitational potencial 
energy. Of course it is possible to affirm that the gas is 
performing work or that heat is "transformed” into 
work! Consider now the well known Joule's apparatus to 
demonstrate the equivalence of work and heat. When 
the masses change their position, the gravitational 
potencial energy (work) is transformed into internal 
energy (heat). Let us consider two "heat reservoirs” al 
temperatures T and T, (T >T,). We can link the two 
reservoirs by radiation and since T >T,, have an 
oriented flux of energy that we can call work because we 
have an oriented energy that can rise a weight! In fact, 
this being so, and if we define heat as energy transfer 
resulting from a temperature difference, then we can say 
that heat is work if we define work as an oriented flux of 
energy! Consider now one more example. A relativistic 
rocket moves by ejection of a photon gas. Try to define 
what is work and what is heat with the First Principle, 
dU=dW+dQ! The classification of energy in work and 
heat has only meaning in the non symmetry of the 
“transformation of the gravitational potential energy 
“(work) into internal energy (heat). In fact if we have the 
same deformation variables of a system in equilibrium 
we verify that work can be transformed into heat not the 
inverse. This being so the internal energy is not only a 
function of the deformation variables and we must 
introduce another variable which contains this non- 
symmetry. This variable, S, is the entropy and the non 
" symmetry may be formally imposed by choosing S as a 
non decreasing function of energy. When the 
deformation variables are the same we have AS=z0 
((MU/98), > 0). 

It should be noted that the final solution is the same 
whatever the pressures are in the initial state, the 
system going through an intermediate stage where 
pressures become equal evolving there upon tó equal 
pressures and temperatures. In fact the final solution is 
“only function of the total energy. If the thermal 
conductivity of the piston takes "small" values other 
than zero and if the piston mass is "high" enough for the 
transformation can be considered "quasi-static”, 
equations (11) and (12) are still verified and final 
equilibrium state is the same, there existing, 
nevertheless, a flow of energy inside the piston. We thus 
conclude that the quantities values J PrzdV,, and j Ti 
ds, exist independently the id conductivity be or 
not be zero, it not being possible to associate them with 
quantities "work" and "heat", since the energy exchange 
is due to the movement of the piston and is not separated 
into two parts with energetic significance: work ([-pdV) 
and heat (/ TdS). 


Técnica - 90 


Rodrigo de Abreu 


3 - Conclusion 


The traditional concepts of work and heat stablished 
by the First Principle of Thermodynamies, 
dU=dW+dqQ, are questioned through the analysis of a 
system constituted of a gas occupying two volumes 
separated by a movable dividing wall with zero thermal 
conductivity. 

Although dU=-pdV+'TdS is a verified along the 
equilibrium points of a quasi-static transformation, and 
although it is possible to formally identify [9] dW =-pdV 
and dQ=TdS, these quantities do not possess the 
physical significance commonly associated with them, in 
that here they do not correspond to energy exchanges 
with a well-defined significance [9]. 

As shown elsewhere [6, 10-13] and as suggested here, 
it is both possible and necessary to formulate 
thermodynamics without resorting to the First 
Principle. 

It is therefore necessary to use the First Principle 
dU=dW+dQ carefully, since -pdV does not always 
signify infinitesimal work [14-16], and TdS does not 
always signify heat [9]. 

The conceptual difficulties of thermodynamics have 
lately been object of special attention in the literature 
[14-38], and in this paper an emphasis is laid on one 
particular aspect which regard as fundamental [6, 10- 
13]. 

The concepts of work and heat must be related 
through the "Second Principle of Thermodynamics" 
when stating the impossibility of the internal energy 
(heat) [6] being converted into work in a transformation 
where the deformation variables are the same at the 
beginning and at the end of the transformation [17]. 
This non-simmetry implies the existence of the quantity 
entropy which never decreases (9U/98>0, because we 
choose that, or the entropy never increases and then we 
have 9U/95<0) [10-13]. It is therefore essential to use 
the designations heat and work in the precise sence 
suggested by the "Second Principle" and not in the sence 
resulting from dU = dW + dQ [6,37,38)]. 


Appendix 


I'm going to show that the assumption that the 
process considered is isentropic is an absurd. 

Let us assume that the transformation is 
isentropic.We have 


E (1) 
E Ú= y 
(Yi P,Vy: 


E Já (II) 
Y-p v'Y 

P, Vo =P, Vo 

From (1) and (ID, P =P andP' =P, we have 


(HI) 
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Since P =P, P'=P' 


Pis Viga, and 


q 


al qã = nRT,, we have 


(IV) 


If T' =T', we have from (III) and (IV) the absurd that 
Ter, 
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RESUMO 


A electrodinâmica de meios em movimento 
relativista é analisada usando uma transformação 
de coordenadas dual da de Galileu. 

Partindo duma transformação semelhante à de 
Lorentz, e tomando o limite v/u2—>o , obtêm-se as 
transformações duais de Galileu. Isto permite 
reduzir a equação de onda à forma hiperbólica 
usual. 


Vacuum electrodynamics with external changes 
and currents may be described in a simple covariant 
manner. 

In moving material media, constitutive relations 
do not, in general, assume a simple form. However 
for many problems of radiation one may assume that 
the index of refraction n=(pe/n e )'* remains 
constant over some range of frequencies. This 
approach has been widely used to study radiation in 
material media [1,8, 5, 71. 

In fact it has been assumed that the equations 
pertaining to vacuum electrodynamics may still be 
used, with the velocity of light c replaced by u=c/n, 
phase velocity of waves in the medium. 

Problems involving uniformly moving charges 
with v<u may be reduced to the static case by this 
transformation. 


ad À (r— vt), Fr 


J =y,(J-9V), 


Although this transformation keeps Maxwell's 
equation and rr-u2t? invariant, it has no physical 
meaning. It is only a useful mathematical aid for 
problem solving purposes. 

For v>u this transformation becomes imaginary 
[4].It is then convenient to find a similar 
transformation which might simplify the derivation 
ofthe fields for v>u. 


ABSTRACT 


Using a coordinate transformation dual of the 
Galilei transform we obtain a significant 
simplification in the determination of the fields in 
moving media. 

We departed from a Lorentz like transform where 
by taking the limit v/u2 — o we obtain a dual 
Galilei transform..This reduces the equations of 
the fields in moving media to the usual hyperbolic 
form. 


By replacing v by u2/v in (1) one obtains; 


2 
+ DR 
Cy W== DR ag A 
2 
u o a v.d (2) 
Seta(s-T0) É v=u(o-"5) 
1 
23 


By using this transformation, the charge density 
disappears and we are led to a simple antenna 
problem. As before, this transformation keeps 
Maxwell's equations and rr-u2t? invariant. When 
v/u->0 transformation (1) reduces to Galilei's. 

By taking the opposite limit v/u?>o in (2) we 
obtain 


v.r 
Per E=r Et (3) 
Ê 


which is similar to a Galilei transform by 
interchanging space and time coordinates. We call it 
a "Dual Galilei Transform”. 

As an example we will apply it to the 
determination of the fields in a moving homogeneous 
medium. 

Departing from Maxwell's equations and 
Minkowsky constitutive relations for a moving 
medium [4]. 


D=c'a E + a(v xH ev (vB) ) 
| (4) 


B =u'aH-— a(vx H+u'v (v.H)) 
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Dual Galilei Transforms 


where 
el jué 
r c 
2 
RE (5) 
1-n?p? 
“ê-1) 8 (6) 
l np? = 
we may write 
E, 
Y xH-ca-— =dJ 
dt 
9H. 
1 
V:. E =—(p+cQd) 
n 4] e'a 
V.H =0 
n n 
where 
d 
=V-0— 
dt 
(a—1) 
E =E-v(v.E)— (8) 
(a-1) 


H =H-=vív.H) ? 
na a 


Owing to the anisotropy caused by the movement, 
the above equations separate into transverse and 
parallel components. 

The transverse part is 


e A 
id a (vxH)= (9) 
vx[7(v.v,) (vH) —-vx [env + (vs) s|) 
e 
(ema) -5 a) xm= (10) 


| E+ val vxvivH)- 
vx[9(v 7, os pad | vX Tr s|) 
Whereas the parallel part takes the form 
D (v.E)=— ( va P E ha 


D (v.H)= =vxYd 


and 


2z 

1 2 a* q 

D =yxvvxv+>(v ) — — ——-— (13) 
n a: n 


ud y? 
P=P-cQJ (14) 
By introducing the Dual Galilei Transformation 
r'=r t'=t— Q.r 
à 3 (15) 
at at 
a! 
(vv-02 )=wm) (16) 
dt 


which gives 


(vv) - a a (17) 


1 
D =vxW.vxV'+ - 
a a 


| 2 à? 7 a” 3º | 
Bi O rd É” O 
[vv-2 | E a (uv) = 


So, the operators are expressed in their normal 
hyperbolic form. 

The solutions of the equations (9), (10), (11) and 
(12) are easily obtained by solving for (v.E) and (v.H) 
in (11) and (12), in the new reference frame. 

The solution to the problem is found by 
introducing the results in equations (9) and (10) and 
transforming back to the original system, 
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